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Description 

[0001] La presente invention concerne de nouveaux polypeptides biologiquement actifs, leur preparation et des 
compositions pharmaceutiques les contenant. 

5 [0002] Plus particulierement, la presente invention concerne des polypeptides recombinants essentiellement com- 
poses d'une partie active derivee d'un polypeptide, nature! ou artificiel, ayant une activite therapeutique, et couple a 
une albumine ou a un variant de I'albumine. II est entendu que I'activite therapeutique des polypeptides de I'invention 
peut etre soit directe (traitement des maladies), ou indirecte (et par exemple utilisable dans la prevention des maladies, 
dans la conception des vaccins, dans les techniques de I'imagerie medicale etc.). 

10 [0003] II est entendu dans ce qui suit que les variants de I'albumine designent toute proteine a haute demie-vie 
plasmatique obtenue par modification (mutation, deletion et/ou addition) par les techniques du genie genetique d'un 
gene codant pour un isomorphe donne de la serum-albumine humaine, ainsi que toute macromolecule a haute demie- 
vie plasmatique obtenue par modification in vitro de la proteine codee par de tels genes. L'albumine etant tres poly- 
morphe, de nombreux variants naturels ont ete identifies et repertories [Weitkamp LR. et al., Ann. Hum. Genet. 37 

15 (1973)219]. 

[0004] Le but de la presente invention est d'elaborer des proteines artificielles biologiquement actives et utilisables 
sur le plan pharmaceutique. En effet, de nombreux polypeptides possedant une ou plusieurs activites therapeutiques 
potentielles ne peuvent etre exploites pharmaceutiquement. Ceci peut avoir differentes raisons, telles que notamment 
leur faible stabilite in vivo, leur structure complexe ou fragile, la difficulty de les produire a une echelle industriellement 
20 acceptable, etc... De meme, certains polypeptides ne donnent pas les resultats attend us in vivo en raison de problemes 
d'administration, de conditionnement, de pharmacocinetique etc... 

[0005] EP 4 1 3 622 divulgue la fusion de CD4 soluble a I'albumine serique. WO 90/1 3653 divulgue certains compo- 
sants particuliers de fusion a I'albumine, pour les objectifs d'une secretion amelioree tout particulierement. WO 
89/02922 divulgue la fusion de CD4 soluble a une molecule apparentee du point de vue de sa structure, a savoir sa 
25 fusion a une chaTne d'immunoglobulines (Ig). 

[0006] La presente invention permet de remedier a ces inconvenients. La presente invention fournit en effet de 

nouvelles molecules permettant une exploitation optimale sur le plan therapeutique des proprietes biologiques de ces 
polypeptides. La presente invention resulte notamment de la mise en evidence qu'il est possible de coupler geneti- 
quement toute structure active derivee d'un polypeptide biologiquement actif a une autre structure proteique constitute 

30 d'albumine, sans en alterer lesdites proprietes biologiques. Elle resulte egalement de la mise en evidence par la de- 
manderesse que la serum-albumine humaine permet de presenter efficacement la structure active a ses sites d'inte- 
raction, et qu'elle assure une stabilite plasmatique elevee du polypeptide de I'invention. Les polypeptides de I'invention 
permettent ainsi de maintenir dans I'organisme une activite biologique donnee pendant un temps prolonge. lis permet- 
tent ainsi de reduire les doses administrees et, dans certains cas, de potentialiser I'effet therapeutique, par exemple 

35 en reduisant les effets secondaires consecutifs a une administration plus importante. Les polypeptides de I'invention 
permettent de plus de generer et d'utiliser des structures derivees des polypeptides biologiquement actifs tres petites 
et done tres specifiques d'un effet recherche. II est entendu que les peptides ayant une activite biologique presentant 
un interet therapeutique peuvent egalement correspondre a des sequences peptidiques non naturelles, isolees par 
exemple a partir de banques peptidiques aleatoires. Les polypeptides de I'invention possedent par ailleurs une repar- 

40 tition particulierement avantageuse dans I'organisme, ce qui modifie leurs proprietes pharmacocinetiques et favorise 
le developpement de leur activite biologique et leur utilisation. En outre, ils presentent egalement I'avantage d'etre 
faiblement ou non-immunogeniques pour I'organisme dans lequel ils sont utilises. Finalement, les polypeptides de 
I'invention peuvent etre exprimes (et preferentiellement secretes) par des organismes recombinants, a des niveaux 
permettant leurs exploitation industrielle. 

45 [0007] Un objet de la presente invention concerne done des polypeptides comportant une partie active derivee d'un 
polypeptide ayant une activite therapeutique, couplee a une albumine ou a un variant de I'albumine. 
[0008] Dans un mode de realisation particulier, les peptides possedant une activite therapeutique ne sont pas d'ori- 
gine humaine. 

[0009] Plus particulierement, dans les molecules de I'invention, le polypeptide ayant une activite therapeutique est 
50 un polypeptide d'origine humaine ou un variant moleculaire. II s'agit de tout ou partie d'une hormone, d'un interferon, 
d'une interleukine, erythropoietine, G-CSF, ou I'insuline. 

[0010] La partie active des polypeptides de I'invention peut etre constituee, par exemple, par le polypeptide ayant 
une activite therapeutique entier, ou par une structure derivee de celui-ci, ou encore par un polypeptide non naturel 
isole a partir d'une banque peptidique. Au sens de la presente invention, on entend par structure derivee tout poly- 
55 peptide obtenu par modification et conservant une activite therapeutique. Par modification, on doit entendre toute 
mutation, substitution, deletion, addition ou modification de nature genetique et/ou chimique. De tels derives peuvent 
etre generes dans des buts differents, tels que notamment celui d'augmenter Taffinite de la molecule pour ses sites 
de fixation, celui d'ameliorer ses niveaux de production, celui d'augmenter sa resistances aux proteases, celui d'aug- 
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menter son efficacite therapeutique ou encore de reduire ses effets secondares, ou celui de lui conferer de nouvelles 
proprietes biologiques. A titre d 'exemple, les polypeptides chimeres de invention possedent des proprietes pharma- 
cocinetiques et une activite biologique utilisable pour la prevention ou le traitement des maladies. 
[0011] Des polypeptides de I'invention particulierement avantageux sont ceux dans lesquels la partie active 
5 presente : 

(a) la structure peptidique entiere ou, 

(b) une structure derivee de (a) par modification structurale (mutation, substitution addition et/ou deletion d'un ou 
plusieurs residus) et possedant une activite therapeutique. 

10 

[0012] Parmi les structures du type (b), on peut citer plus particulierement les molecules dans lesquelles certains 
sites de N- ou O-glycosylation ont ete modifies ou supprimes, les molecules dans lesquelles un ou plusieurs residus 
ont ete substitues, ou les molecules dans lesquelles tous les residus cysteine ont ete substitues. On peut citer egale- 
ment des molecules obtenues a partir de (a) par deletion de regions n'intervenant pas ou peu dans ['interaction avec 
15 les sites de .liaison consideres, ou exprimant une activite indesirable, et des molecules comportant par rapport a (a) 
des residus supplementaires, tels que par exemple une methionine N-terminale et/ou un signal de secretion et/ou un 
peptide dejonction. 

[0013] La partie active des molecules de I'invention peut etre couplee soit directement soit par I'intermediaire d'un 
peptide artificiel a I'albumine. De plus, elle peut constituer I'extremite N-terminale comme I'extremite C-terminale de 
20 la molecule. Preference llement, dans les molecules de I'invention, la partie active constitue la partie C-terminale de la 
chimere. II est egalement entendu que la partie biologiquement active peut etre redondante au sein de la chimere. 
Une representation schematique des molecules de ['invention est donnee a la Figure 1. 

[0014] Un autre objet de invention concerne un precede de preparation des molecules chimeres decrites ci-avant. 
Plus precisement, ce procede consiste a faire exprimer par un note cellulaire eucaryote ou procaryote une sequence 
25 nucleotidique codant pour le polypeptide desire, puis a recolter le polypeptide produit. 

-[00.15] . Parmi les notes eucaryotes utilisables dans le cadre de la presente invention, on peut.citer les cellules ani- 

males, les levures, ou les champignons. En particulier, s'agissant de levures, on peut citer les levures du genre Sac- 
charomyces, Kluyveromyces, Pichia, Schwanniomyces, ou Hansenula. S'agissant de cellules ani males, on peut citer 
les cellules COS, CHO, C127, etc... Parmi les champignons susceptibles d'etre utilises dans la presente invention, on 

30 peut citer plus particulierement Aspergillus ssp. ou Trichoderma ssp. Comme notes procaryotes, on prefere utiliser les 
bacteries telles que Escherichia coli, ou appartenant aux genres Corynebacterium, Bacillus, ou Streptomyces. 
[0016] Les sequences nucleotidiques utilisables dans le cadre de la presente invention peuvent etre preparees de 
differentes manieres. Generalement, elles sont obtenues en assemblant en phase de lecture les sequences codant 
pour chacune des parties fonctionnelles du polypeptide, Celles-ci peuvent etre isolees par les techniques de I'homme 

35 de Tart, et par exemple directement a partir des ARN messsagers (ARNm) cellulaires, ou par reclonage a partir d'une 
banque d'ADN complementaire (ADNc), ou encore il peut s'agir de sequences nucleotidiques totalement synthetiques. 
II est entendu de plus que les sequences nucleotidiques peuvent egalement etre ulterieurement modifiees, par exemple 
par les techniques du genie genetique, pour obtenir des derives ou des variants desdites sequences. 
[0017] Plus preferentiellement, dans le procede de I'invention, la sequence nucleotidique fait partie d'une cassette 

*o d'expression comprenant une region d'initiation de la transcription (region promoteur) permettant, dans les cellules 
notes, ('expression de la sequence nucleotidique placee sous son controle et codant pour les polypeptides de I'inven- 
tion. Cette region peut proven ir de regions promoteurs de genes fortement exprimes dans la cellule hote utilisee, 
I'expression etant constitutive ou regulable. S'agissant de levures, il peut s'agir du promoteur du gene de la phospho- 
glycerate kinase (PGK), de la glyceraldehyde-3-phosphate dehydrogenase (GPP), de la lactase (LAC4 ), des enolases 

45 (ENO) , des alcools deshydrogenases (ADH) , etc. S'agissant de bacteries, il peut s'agir du promoteur des genes droit 
ou gauche du bacteriophage lambda (P L , P R ), ou encore des promoteurs des genes des operons tryptophane (P^) 
ou lactose (P|ac). En outre, cette region de controle peut etre modifiee, par exemple par mutagenese in vitro , par 
introduction d'elements additionnels de controle ou de sequences synthetiques, ou par des deletions ou des substitu- 
tions des elements originels de controle. La cassette d'expression peut egalement comprendre une region de termi- 

50 natson de la transcription fonctionnelle dans I'hote envisage, positionnee immediatement en aval de la sequence nu- 
cleotidique codant pour un polypeptide de I'invention. 

[0018] Dans un mode prefere, les polypeptides de I'invention resultent de I'expression dans un hote eucaryote ou 
procaryote d'une sequence nucleotidique et de la secretion du produit d'expression de ladite sequence dans le milieu 
de culture. II est en effet particulierement avantageux de pouvoir obtenir par voie recombinante des molecules direc- 
55 tement dans le milieu de culture. Dans ce cas, la sequence nucleotidique codant pour un polypeptide de I'invention 
est precedee d'une sequence "leader" (ou sequence signal) dirigeant le polypeptide naissant dans les voies de secre- 
tion de I'hote utilise. Cette sequence "leader" peut etre la sequence signal naturelle du polypeptide biologiquement 
actif dans le cas ou celui-ci est une proteine naturellement secretee, ou celle de la structure stabilisatrice, mais il peut 
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egalement s'agir de toute autre sequence "leader" fonctionnelle, ou d'une sequence "leader" artificielle. Le choix de 
Tune ou I'autre de ces sequences est notamment guide par I'hote utilise. Des exempies de sequences signal fonction- 
nelles incluent celles des genes des pheromones sexuelles ou des toxines "killer" de levures. 
[0019] En plus de la cassette d'expression, un ou plusieurs marqueurs permettant de selectionner I'hote recombine 
5 peuvent etre additionnes, tels que par exemple le gene URA3 de la levure S. cerevisiae, ou des genes conferant la 
resistance a des antibiotiques comme la geneticine (G418) ou a tout autre compose toxique comme certains ions 
metalliques. 

[0020] L'ensemble constitue par la cassette d'expression et par le marqueur de selection peut etre introduit directe- 
ment dans les cellules notes considerees, soit insere prealablement dans un vecteur autoreplicatif fonctionnel. Dans 

10 le premier cas, des sequences homologues a des regions presentes dans le genome des cellules hotes sont prefe- 
rentiellement additionnees a cet ensemble; lesdites sequences etant alors positionnees de chaque cote de la cassette 
d'expression et du gene de selection de facon a augmenter la frequence d'integration de l'ensemble dans le genome 
de I'hote en ciblant ('integration des sequences par recombinaison homologue. Dans le cas ou la cassette d'expression 
est inseree dans un systeme replicatif, un systeme de replication prefere pour les levures du genre Kluyveromyces 

15 est derive du plasm ide pKD1 initialement isole de K.drosophilarum; un systeme prefere de replication pour les levures 
du genre Saccharomyces est derive du plasmide 2\i de S. cerevisiae. De plus, ce plasmide d'expression peut contenir 
tout ou partie desdits systemes de replication, ou peut combiner des elements derives du plasmide pKD1 aussi bien 
que du plasmide 2\i. 

[0021] En outre, les plasmides d'expression peuvent etre des vecteurs navettes entre un note bacterien tel que 
20 Escherichia coli et la cellule note choisie. Dans ce cas, une origine de replication et un marqueur de selection fonc- 
tionnant dans I'hote bacterien sont requises. II est egalement possible de positionner des sites de restriction entourant 
les sequences bacteriennes et uniques sur le vecteur d'expression: ceci permet de supprimer ces sequences par 
coupure et religature in vitro du vecteur tronque avant transformation des cellules hotes, ce qui peut resulter en une 
augmentation du nombre de copies et en une stabilite accrue des plasmides d'expression dans lesdits hotes. Par 
25 exemple, de tels sites de restriction peuvent correspondre aux sequences telles que 5-GGCCNNNNNGGCC-3' (Sfil) 

— - -ou 5I-GCGGCCGC-3' (Notl) dans la mesure ou ces sites sontextremement rares et generalement absents d'un vecteur 

d'expression. 

[0022] Apres construction de tels vecteurs ou cassette d'expression, ceux-ci sont introduits dans les cellules hotes 
retenues selon les techniques classiques decrites dans la litterature. A cet egard, toute methode permettant d'introduire 

30 un ADN etranger dans une cellule peut etre utilisee. II peut s'agir notamment de transformation, electroporation, con- 
jugaison, ou toute autre technique connue de I'homme de Tart. A titre d'exemple pour les hotes de type levure, les 
differentes souches de Kluyveromyces utilisees ont ete transformees en traitant les cellules entieres en presence 
d'acetate de lithium et de polyethylene glycol, selon la technique decrite par Ito et al. [J. Bacteriol. 153 (1983) 163]. La 
technique de transformation decrite par Durrens et al. [Curr. Genet 18 (1990) 7] utilisant I'ethylene glycol et le dime- 

35 thylsulfoxyde a egalement ete utilisee. II est aussi possible de transformer les levures par electroporation, selon la 
methode decrite par Karube et al. [FEBS Letters 182 (1985) 90]. Un protocole alternatif est egalement decrit en detail 
dans les exempies qui suivent. 

[0023] Apres selection des cellules transformees, les cellules exprimant lesdits polypeptides sont inoculees et la 
recuperation desdits polypeptides peut etre faite, soit au cours de la croissance cellulaire pour les precedes "en con- 
40 tinu", soit en fin de croissance pour les cultures "en lots" ("batch"). Les polypeptides qui font I'objet de la presente 
invention sont ensuite purifies a partir du surnageant de culture en vue de leur caracterisation moleculaire, pharma- 
cocinetique et biologique. 

[0024] Un systeme d'expression prefere des polypeptides de I'invention consiste en I'utilisation des levures du genre 
Kluyveromyces comme cellule hote, transformees par certains vecteurs derives du replicon extrachromosomique pKD1 

45 initialement isole chez K. marxianus var. drosophilarum. Ces levures, et en particulier K. lactis et K. fragilis sont gene- 
ralement capables de repliquer lesdits vecteurs de facon stable et possedent en outre I'avantage d'etre incluses dans 
la liste des organismes G.R.A.S. ("Generally Recognized As Safe"). Des levures privilegiees sont preferentiellement 
des souches industrielles du genre Kluyveromyces capables de repliquer de facon stable lesdits plasmides derives 
du plasmide pKD1 et dans lesquels a ete insere un marqueur deselection ainsi qu'une cassette d'expression permettant 

50 la secretion a des niveaux eleves des polypeptides de invention. 

[0025] La presente invention concerne egalement les sequences nucleotidiques codant pour les polypeptides chi- 
meres decrits ci-avant, ainsi que les cellules recombinantes, eucaryotes ou procaryotes, comprenant de telles sequen- 
ces. 

[0026] La presente invention concerne aussi ('application a titre de medicament des polypeptides selon la presente 
55 invention. Plus particulierement, invention a pour objet toute composition pharmaceutique comprenant un ou plusieurs 
polypeptides ou sequences nucleotidiques tels que decrits ci-avant. Les sequences nucleotidiques peuvent en effet 
etre utilisees en therapie genique. 

[0027] La presente invention sera plus complement decrite a I'aide des exempies qui suivent, qui doivent etre 
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considers comme illustratifs et non limitatifs. 
USTE PES FIGURES 

5 [0028] Les representations des plasmides indiquees dans !es Figures suivantes ne sont pas tracees a I'echelle et 
seuls les sites de restriction importants pour la comprehension des clonages realises ont ete indiques. 

Figure 1 : Schematisation des chimeres du type SAH-PEPTIDE (A), du ype PEPTTDE-SAH (B) ou PEPTI- 
DE-SAH-PEPTIDE (C). Abreviations utilisees : M/LP, residu methionine initiateur de la traduction, eventuellement 
10 suivie d'une sequence signal desecration; SAH, al bum ine mature ouundeses variants moleculaires; PER peptide 

d'origine naturelle ou artificielle possedant une propriete therapeutique donnee. La sequence PEP peut etre pre- 
sente plusieurs fois dans les molecules de type A, B ou C. La fleche noire indique I'extremite N-terminale de la 
proteine mature. 

*s SEQ ID n° 1: Exemples de sequences nucleotidiques d'un fragment de restriction Hind lll codant pour une 

proteine chimere du type prepro-SAH-PEPTIDE. Les fleches noires indiquent la fin des regions "pre" et "pro" 
de la SAH. Le site de restriction Mstll est souligne et le codon specifiant la terminaison de la traduction est 
en caracteres gras. 

20 Figure 3 : Carte de restriction du plasmide pYG105 et strategie generique de construction des plasmides d'ex- 

pression des proteines chimeres de la presente invention. Abreviations utilisees : P t promoteur transcriptionnel ; 
T, terminateur transcriptionnel ; IR, sequences repetees inversees du plasmide pKD1 ; LP, sequence signal de 
secretion ; Ap r et Km r designent respectivement les genes de resistance a rampicilline (E. coli) et au G418 (levu- 
res). 

25 

- - Figure 4.: Exemples de sequences.nucleotidiques de fragments de restriction Mstll -Hind lll derives du facteur von. 

Willebrand. Representation de la structure des fragments Mstll- Hind lll des plasmides pYG1248 (panneau A), 
pYG1214 (panneau B), pYG1206 [panneau C, dans cette chimere particuliere le residu Leu694 du vWF est ega- 
lement le dernier residu (Leu585) de la SAH] et pYG1223 (panneau D) ; la numerotation des acides amines cor- 

30 respond a la numerotation du vWF mature d'apres Tltani et al. [Biochemistry 25 (1986) 3171-3184]. Les sites de 

restriction Mst ll et Hind lll sont soulignes et le codon de terminaison de la traduction est en caracteres gras. SEQ 
ID n° 2 : sequence nucleotidique du fragment de restriction Mstll- Hind lll du plasmide pYG1248. La numerotation 
des acides amines (colonne de droite) correspond a la proteine chimere SAH-vWF470->713 mature (829 residus). 
Les residus Thr4 70, Leu494, Asp498, Pro502, Tyr508, Leu694, Pro704, et Pro708 du vWF mature sont soulignes. 

35 

Figure 5 : Caracterisation du materiel secrete apres 4 jours de culture (erlenmeyers) de la souche CBS 293.91 
transformee par les plasmides pYG1248 (plasmide d'expression d'une chimere du type SAH-vWF 
Thr470->Val713) et pKan707 (plasmide controle). Dans cette experience les resultats des panneaux A, B, et C 
ont ete migres sur le meme gel (SDS-PAGE 8,5 %) puis traites separemment. 

40 

A, coloration au bleu de coomassie; standard de poids moleculaire (piste 2); surnageant equivalent a 50 \i\ 
de la culture transformee par les plasmides pKan707 en milieu YPL (piste 1), ou pYG1248 en milieu YPD 
(piste 3) ou YPL (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de souris diriges contre le 
45 vWF humain: meme legende qu'en A a I'exception que des standards biotiniles de poids moleculaire ont ete 

utilises. 

C, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de lapin diriges contre I'al- 
bumine humaine: surnageant equivalent a 50 jxl de la culture transformee par les plasmides pKan707 en milieu 
YPL (piste 1), ou pYG1248 en milieu YPD (piste 2) ou YPL (piste 3). 

50 

Figure 6 : Cinetique de secretion d'une chimere de I'invention par la souche CBS 293.91 transformee par le plas- 
mide pYG1206 (SAH-vWF Leu694-Pro708). 

A, coloration au bleu de coomassie ; standard de poids moleculaire (piste 1) ; surnageant equivalent a 2,5 \i\ 
55 d'une culture "Fed Batch" en milieu YPD apres 24h. (piste 2), 40h. (piste 3) ou 46h. (piste 4) de croissance. 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps de souris diriges contre le 
vWF humain : meme legende qu'en A a I'exception que des standards biotiniles de poids moleculaire ont ete 
utilises. 
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Figure 7 : Caracterisation du materiel secrete par K. lactis transforme par les plasmides pKan707 (plasmide con- 
trole, piste 2), pYG1206 (piste 3), pYG1214 (piste 4) et pYG1223 (piste 5) ; standard de poids moleculaire (piste 
1). Les depots correspondent a 50 pj de surnageant d'une culture stationnaire apres croissance en milieu YPD, 
migration dans un gel a 8.5 % d'acrylamide et coloration au bleu de coomassie. 

SEQ ID n° 3: Sequence nucleotidique du fragment de restriction Mstll -Hind lll du plasmide pYG1341 
(SAH-UK1->135). La limite du domaine EGF-like (UK1->46) present dans Je fragment de restriction Mstll- 
Hind lll du plasmide pYG1340 est indiquee. La numerotation des acides amines correspond a la proline 
chimere SAH-UK1->135 mature (720 residus). 

Figure9 : Secretion des chimeres SAH-UK1-46 et SAH-UK1-135 par la souche CBS 293.91 respectivement trans- 
form^ par les plasmides pYG1343 (SAH-UK1-46) et pYG1345 (SAH-UK1-135), apres 4 jours de croissance (mi- 
lieu YPL+G418). Les depots (equivalents a 50 uJ de culture) sont migres en gel PAGE-SDS a 8,5 % et colores au 
bleu de coomassie: surnageant d'un clone transform^ par les plasmides pKan707 (piste 1), pYG1343 (piste 3) ou 
pYG1345 (piste 4) ; standard de poids moleculaire (piste 2). 

SEQ ID n° 4 : Sequence nucleotidique du fragment de restriction Mstll- Hind lll du plasmide pYG1 259 (SAH-G. 
CSF). La limite de la partie G-CSF (174 residus) est indiquee. Les sites de restriction Apal et Sstl (Sstl) sont 
soulignes. La numerotation des acides amines correspond a la proteine chimere SAH-G.CSF mature (759 
residus). 

SEQ ID n° 5 : Sequence nucleotidique du fragment de restriction Hindi 1 1 du plasmide pYG1301 (chimere G. 
CSF-Gly 4 -SAH). Les fleches noires indiquent la fin des regions "pre" et "pro" de la SAH. Les sites de restriction 
Apa l, Sst l (Sacl) et Mstll sont soulignes. Les domaines G.CSF (1 74 residus) et SAH (585 residus) sont separds 
par le linker synthetique GGGG. La numerotation des acides amines correspond a la proteine chimere G. 
. . . . CSF-Gly4-SAH mature (763 residus). La sequence. nucleotidique comprise entre.le.codon de terminaison de 
la traduction et le site Hind i!! provient de I'ADN complementaire (cDNA) de la SAH tel que decrit dans la 
demande de brevet EP 361 991. 

Figure 12 : Caracterisation du materiel secrete apres 4 jours de culture (erlenmeyers) de la souche CBS 293.91 
transformee par les plasmides pYG1266 (plasmide d'expression d'une chimere du type SAH-G.CSF) et pKan707 
(plasmide controle). Dans cette experience les resultats des panneaux A, B, et C ont ete migres sur le meme gel 
(SDS-PAGE 8,5 %) puis traites separemment. 

A, coloration au bleu de coomassie; standard de poids moleculaire (piste 2) ; surnageant equivalent a 100u.l 
de la culture transformee par les plasmides pKan707 en milieu YPL (piste 1), ou pYG1266 en milieu YPD 
(piste 3) ou YPL (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre le 
G-CSF humain : meme legende qu'en A. 

C, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre 
I'albumine humaine : meme legende qu'en A. 

Figure 13 : Caracterisation du materiel secrete apres 4 jours de culture (erlenmeyers en milieu YPD) de la souche 
CBS 293.91 transformee par les plasmides pYG1267 (chimere SAH-G.CSF), pYG1303 (chimere G. 
CSF-Gly 4 -SAH) et pYG1352 (chimere SAH-Gly 4 -G.CSF) apres migration sur gel SDS-PAGE 8,5 %. 

A, coloration au bleu de coomassie ; surnageant equivalent a 1 00 \i\ de la culture transformee par les plasmides 
pYG1303 (piste 1), pYG1267 (piste 2) ou pYG1352 (piste 3); standard de poids moleculaire (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre le 
G-CSF humain : meme legende qu'en A. 

SEQ ID n° 6: Sequence nucleotidique du fragment de restriction Mstll -Hind lll du plasmide pYG1382 
(SAH-Fv'). Les domaines VH (124 residus) et VL (107 residus) du fragment Fv' sont separes par le linker 
synthetique (GGGGS)^. La numerotation des acides amines correspond a la proteine chimere SAH-Fv' ma- 
ture (831 residus). 

Figure 15 : Secretion de la chimere SAH-Fv' par la souche CBS 293.91 transformee par le plasmide pYG1383 
(LAC4) apres 4 jours de croissance en erlenmeyers a 28°C en milieu YPD (piste 2), ou YPL (piste 3) ; standard 
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de poids moleculaire (piste 1). Les depots, equivalents a 200 uJ de culture (precipitation a I'ethanol), sont migres 
en gel PAGE-SDS (8,5 %). 

A, : coloration du gel au bleu de coomassie. 
5 B, : caracterisation immunologique du materiel secrete apres utilisation d'anticorps primaires diriges contre 

la SAH. 

Figure 16: Dosage de I'activite antagoniste in vitro de ['agglutination des plaquettes humaines fixees au 
formaldehyde : CI50 des hybrides SAH-vWF694-708, [SAH-vWF470-713 C471G, C474G] et [SAH-vWF470-704 
10 C471G, C474G] relativement a letalon RG12986. La determination de I'inhibition dose-dependante de I'aggluti- 

nation plaquettaire est realisee selon la methode decrite par C. Prior et al. [Bio/Technology ( 1 992)1066] en utilisant 
un agregametre enregistrant les variations de la transmission optique sous agitation a 37°C en presence de vWF 
humain, de botrocetine (8,2 mg/ml) et du produit a tester a differentes dilutions. La concentration du produit qui 
permet d'inhiber de moitie I'agglutination controle (en I'absence de produit) est alors determinee (CI50). 

15 

Figure 17 : Activite sur la proliferation cellulaire in vitro de la lignee murine NFS60. La radioactivite ^H-thymidine) 
incorporee dans les noyaux cellulaires apres 6 heures d'incubation est representee en ordonnee (cpm) ; la quantite 
de produit indiquee en abscisse est exprimee en molarity (unites arbitral res). 

20 Figure 18 : Activite sur la granulopoiese in vivo chez le rat. Le nombre de neutrophiles (moyenne de 7 animaux) 

est indiquee en ordonnee en fonction du temps. Les produits testes sont la chimere SAH-G.CSF (pYG1266, 4 ou 
40 mg/rat/jour), le G-CSF reference (10 mg/rat/jour), la SAH recombinante purifiee a partir de sumageant de 
Kluyveromyces lactis (SAH, 30 mg/rat/jour, cf. EP 361 991), ou du serum physiologique. 

25 EXEMPLES 

TECHNIQUES GENERALES DE CLONAGE 

[0029] Les methodes classiquement utilisees en biologie moleculaire telles que les extractions preparatives d'ADN 
30 plasmidique, la centrifugation d'ADN plasmidique en gradient de chlorure de cesium, I'dlectrophorese sur gels d'aga- 
rose ou d'acrylamide, la purification de fragments d'ADN par electrocution, les extraction de proteines au phenol ou 
au phenol-chloroforme, la precipitation d'ADN en milieu salin par de I'ethanol ou de I'isopropanol, la transformation 
, dans Escherichia coli etc ... sont bien connues de Thorn me de metier et sont abondament decrites dans la Htterature 
[Maniatis T. et al., "Molecular Cloning, a Laboratory Manual", Cold Spring Harbor Laboratory, Cold Spring Harbor, N. 
35 Y., 1982 ; Ausubel F.M. et al. (eds), "Current Protocols in Molecular Biology", John Wiley & Sons, New York, 1987]. 
[0030] Les enzymes de restriction ont ete foumies par New England Biolabs (Biolabs), Bethesda Research Labo- 
ratories (BRL) ou Amersham et sont utilisees selon les recommandations des fournisseurs. 

[0031] Les plasmides de type pBR322, pUC et les phages de la serie M13 sont d'origine commerciale (Bethesda 
Research Laboratories). 

40 [0032] Pour les ligatures, les fragments d'ADN sont separes selon leur taille par electrophorese en gels d'agarose 
ou d'acrylamide, extraits au phenol ou par un melange phenol/chloroform e, precipites a I'ethanol puis incubes en 
presence de I'ADN ligase du phage T4 (Biolabs) selon les recommandations du foumisseur. 

[0033] Le remplissage des extremites 5' proeminentes est effectue par le fragment de Klenow de I'ADN Polymerase 
I d 'E. coli (Biolabs) selon les specifications du foumisseur. La destruction des extremites 3' proeminentes est effectuee 

45 en presence de I'ADN Polymerase du phage T4 (Biolabs) utilisee selon les recommandations du fabricant. La des- 
truction des extremites 5' proeminentes est effectuee par un traitement menage par la nuclease S1. 
[0034] La mutagenese dirigee in vitro par oligodeoxynucleotides synthetiques est effectuee selon la methode deve- 
ioppee par Taylor et al. [Nucleic Acids Res. 13^ (1985) 8749-8764] en utilisant le kit distribue par Amersham. 
[0035] L'amplification enzymatique de fragments d'ADN par la technique dite de PCR [Polymerase-catalyzed Chain 

50 Reaction, Saiki R.K. et al., Science 230 (1985) 1350-1354; Mullis K.B. et Faloona F.A., Meth. Enzym. 155 (1987) 
335-350] est effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer Cetus) selon les specifications du fabricant. 
[0036] La verification des sequences nucleotidiques est effectuee par la methode developpee par Sanger et al. [Proc. 
Natl. Acad. Sci. USA, 74 (1977) 5463-5467] en utilisant le kit distribue par Amersham. 

[0037] Les transformations de K. lactis avec I'ADN des plasm ides d'expression des proteines de la presente invention 
55 sont effectuees par toute technique connue de I'homme de Tart, et dont un exemple est donne dans le texte. 

[0038] Sauf indication contraire, les souches bacteriennes utilisees sont E. coli MC1060 (laclPOZYA, X74, galU, 

galK, strAQ, ou E. coli TG1 (lac, proA,B, sup E, ttii, hsdDS / FtraD36, proA + B + , jac|q, lacZ, M15). 

[0039] Les souches de levures utilisees appartiennent aux levures bourgeonnantes et plus particulierement aux 
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levures du genre Kluyveromyces. Les souche KJactis MW98-8C (a, uraA , arg , lys, K + , pKD1°) et K. lactis CBS 293.91 
ont ete particulierement utilisees; un echantillon de la souche MW98-8C a ete depose le 16 Septembre 1988 au Cen- 
traalbureau voor Schimmelkulturen (CBS) a Baarn (Pays Bas) ou il a ete enregistre sous le numero CBS 579.88. 
[0040] line souche bacterienne (E. coli ) transformee avec le plasmide pET-8c52K a ete deposee le 17 Avril 1990 
5 aupres de I'American Type Culture Collection sous le numero ATCC 68306. 

[0041] Les souches de levures transformees par les plasmides d'expression codant pour les proteines de la presente 
invention sont cultivees en erlenmeyers ou en fermenteurs pilotes de 21 (SETRIC, France) a 28°C en milieu riche 
(YPD: 1% yeast extract, 2% Bactopeptone, 2% glucose; ou YPL: 1% yeast extract, 2% Bactopeptone, 2% lactose) 
sous agitation constante. 

10 

EXEMPLE 1 : COUPLAGE EN C-TERMINAL DE LA SAH 

[0042] Le plasmide pYG404 est decrit dans la demande de brevet EP 361 991. Ce plasmide comporte un fragment 
de restriction Hind i!! codant pour !e gene de la prepro-SAH precede des 21 nucleotides naturellement presents imme- 

15 diatement en amont de I'ATG initiateur de traduction du gene PGK de S. cerevisiae. La sequence nucleotidique de ce 
fragment de restriction est incluse dans la sequence ID n° 2. Le site Mstll localise dans la sequence codante, a trols 
residus du codon specrfiant la fin de traduction est particulierement utile comme site de clonage d'un peptide biologi- 
quement actif que Ton desire coupler en phase traductionnelle en C-terminal de la SAH. Dans un mode de realisation 
particulier, il est utile d'utiliser des peptides dont la sequence est codee par un fragment de restriction Mstll -Hind i II du 

20 type : 5- CCTTAGGCTTA [3xN]p TAAGCTT -3', la sequence codant le peptide (p residus) biologiquement actif est [3xN] 
p). La ligature de ce fragment avec le fragment de restriction Hind i! I-Mstll correspondant a la totalite du gene codant 
pour la SAH a I'exception des trois acides amines les plus C-terminaux (residus leucine-glycine-leucine) genere un 
fragment de restriction Hindlll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE 
(Figure 1, panneau A), immediatement precedee de la region d'exportation "prepro" de la SAH. Dans un autre mode 

25 de realisation, le peptide biologiquement actif peut etre present plus d'une fois dans la chimere. 

EXEMPLE 2: COUPLAGE EN N-TERMINAL DE LA SAH 

[0043] Dans un mode realisation particulier, les techniques combinees de mutagenese dirigee et d'amplification PCR 
30 permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre un peptide signal (et par exemple la region prepro de la SAH), une sequence incluant le peptide biologiquement 
actif et la forme mature de la SAH ou un de ses variants moleculaires. Ces genes hybrides sont preferentiellement 
bordes en 5' de I'ATG initiateur de traduction et en 3' du codon de fin de traduction par des sites de restriction Hind lll 
et codent pour des proteines chimeres du type PEPTIDE-SAH (Figure 1 , panneau B). Dans un mode realisation encore 
35 plus particulier, le peptide biologiquement actif peut etre present plus d'une fois dans la chimere. 

EXEMPLE 3: COUPLAGE EN N-ET C-TERMINAL DE LA SAH 

[0044] Les techniques combinees de mutagenese dirigee et d'amplification PCR decrites dans les exemples 1 et 2 
<o permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre la forme mature de la SAH, ou un de ses variants moleculaires, et un peptide biologiquement actif couple aux 
extremites N- et C-terminales de la SAH. Ces genes hybrides sont preferentiellement bordes en 5' de I'ATG initiateur 
de traduction et en 3' du codon de fin de traduction par des sites de restriction Hind lll et codent pour des proteines 
chimeres du type PEPTI DE-SAH-PEPTI DE (Figure 1, panneau C), immediatement precedeesde la region d'exporta- 
45 tion "prepro" de la SAH. Dans un mode realisation encore plus particulier, le peptide biologiquement actif peut etre 
present plus d'une fois dans la chimere. 

EXEMPLE 4 : PLASMIDES D'EXPRESSION 

so [0045] Les proteines chimeres des exemples precedents peuvent etre exprimees dans les levures a partir de pro- 
moteurs fonctionnels, regulables ou constitutifs, tels que, par exemple, ceux presents dans les plasmides pYG105 
(promoteur LAC 4 de Kluyveromyces lactis) , pYG1 06 (promoteur PGK de Saccharomyces cerevisiae) , pYG536 (pro- 
moteur PHQ 5 de S. cerevisiae) , ou des promoteur hybrides tels que ceux decrits dans la demande de brevet EP 361 
991 . Les plasmides pYG 1 05 et pYG1 06 sont ici particulierement utiles car ils permettent Texpression des genes codes 

55 par les fragments de restriction Hind lll tel que decrits dans les exemples precedents et clones dans le site Hind lll et 
dans I'orientation productive (definie comme I'orientation qui place la region "prepro" de I'albumine de facon proximale 
par rapport au promoteur de transcription), a partir de promoteurs fonctionnels chez K.lactis, regulables (p YG 1 05) ou 
constitutifs (pYG106). Le plasmide pYG105 correspond au plasmide pKan707 decrit dans la demande de brevet EP 



8 



EP 0 624 195 B1 



361 991 dans lequel le site de restriction Hind lll unique et localise dans le gene de resistance a la gen&icine (G418) 
a ete detruit par mutagenese dirigee tout en conservant une proteine inchangee (oligodeoxynucleotide 5-GAAATGCA- 
TMGCTCTTGCCATTCTCACCG-3'). Le fragment Sall-Sacl codant pour le gene URA3 du plasmide mute a 6t<§ ensuite 
remplac6 par un fragment de restriction Sall-Sacl comportant une cassette d'expression constitute du promoteur LAC4 
5 de K. lactis (sous la forme d'un fragment Sall- Hind lll) et du terminateur du gene PGK de S. cerevisiae (sous la forme 
d'un fragment Hindlll-Sacl). Le plasmide pYG105 est mitotiquement tres stable chez les levures Kluyveromyces et 
une carte de restriction en est donnee a la Figure 3. Les plasmides pYG105 et pYG106 ne different entre eux que par 
la nature du promoteur de transcription encode par le fragment Sall- Hind lll. 

10 EXEMPLE 5 : TRANSFORMATION DES LEVURES 

[0046] La transformation des levures appartenant au genre Kluyveromyces, et en particulier les souches MW98-8C 
et CBS 293.91 de K. lactis, s'effectue par exemple par la technique de traitement des cellules entieres par de I'acetate 
de lithium [Ito H. et al., J. Bacteriol. j153 (1983) 163-168], adaptee comme suit. La croissance des cellules se fait a 

15 28°C dans 50 ml de milieu YPD, avec agitation et jusqu'a une densite optique a 600 nm (DO 600 ) comprise entre 0,6 
et 0,8; les cellules sont recoltees par centrifugation a faible vitesse, lavees dans une solution sterile de TE (10 mM 
Tris HCI pH 7,4; 1 mM EDTA), resuspendues dans 3-4 ml d'acetate lithium (0,1 M dans du TE) pour obtenir une densite 
cellulaire d'environ 2 x 10 8 cellules/ml, puis incubees a 30°C pendant 1 heure sous agitation moderee. Des aliquotes 
de 0,1 ml de la suspension resultante de cellules competentes sont incubes a 30°C pendant 1 heure en presence 

20 d'ADN et a une concentration finale de 35% de polyethylene glycol (PEG^qq, Sigma). Apres un choc thermique de 5 
minutes a 42°C, les cellules sont lavees 2 fois, resuspendues dans 0,2 ml d'eau sterile et incubees 16 heures a 28°C 
dans 2 ml de milieu YPD pour permettre I'expression phenotypique du gene de resistance au G418 exprime sous 
controle du promoteur P k1 (cf. EP 361 991); 200 |xl de la suspension cellulaire sont ensuite etales sur boites YPD 
selectives (G418, 200 jig/ml). Les boites sont mises a incuber a 28°C et les transfomiants apparaissent apres 2 a 3 

25 jours de croissance cellulaire. 

EXEMPLE 6 : SECRETION DES CHIMERES 

[0047] Apres selection sur milieu riche supplements en G4 1 8 les clones recombinants sont testes pour leur capacite 
30 a secreter la forme mature des proteines chimeres. Quelques clones correspondant a la souche CBS 293.91 ou 
MW98-8C transformee par les plasmides d'expression des chimeres entre la SAH et la partie biologiquement active 
sont mis a incuber en milieu YPD ou YPL a 28°C. Les sumageants cellulaires sont recuperes par centrifugation quand 
les cellules atteignent la phase stationnaire de croissance, eventuellement concentres 1 0 fois par precipitation pendant 
30 minutes a -20°C dans une concentration finale de60% d'ethanol, puis testes apres electrophoreseen gel SDS-PAGE 
35 a 8.5%, soit directement par coloration du gel par du bleu de coomassie, soit apres immunoblot en utilisant des anticorps 
primaires diriges contre la partie biologiquement active ou un serum polyclonal de lapin dirige contre la SAH. Lors des 
experiences de detection immunologique, le filtre de nitrocellulose est d'abord incube en presence des anticorps pri- 
maires specifiques, lave plusieurs fois, incube en presence d'anticorps de chevre diriges contre les anticorps primaires, 
puis incubt en presence d'un complexe avidine-peroxydase en utilisant le "kit ABC distribue par Vectastain (Biosys 
40 S.A., Compiegne, France). La reaction immunologique est ensuite revelee par addition de diamino-3,3' benzidine te- 
trachlorydrate (Prolabo) en presence d'eau oxygenee, selon les recommandations du fabricant. 

EXEMPLE 7 : CHIMERES DERIVEES DU FACTEUR VON WILLEBRAND 

<5 E.7.1. Fragments antagonistes de la fixation du vWF aux plaquettes. 

E.7.1.1. Residus Thr470-Val713 du vWF. 

[0048] Le plasmide pET-8c52K comporte un fragment du cDNA du vWF codant pour les residus 445 a 733 du vWF 
50 humain et inclus done plusieurs determinants cruciaux de ['interaction entre le vWF et les plaquettes d'une part, et 
certains elements de la membrane basale et du tissu sous-endothelial d'autre part, et notamment les peptides G10 et 
D5 antagonistes de Interaction entre vWF et GP1b [Mori H. et al., J. Biol. Chem. 263 (1988) 17901-17904]. Cette 
sequence peptidique est identique a la sequence correspondante decrite par Titani et al. [Biochemistry 25 (1986) 
3171-3184]. L'amplification de ces determinants genetiques peut etre realisee a partir du plasmide pET-8c52K, par 
55 exemple par la technique d'amplification PCR, en utilisant comme amorce des oligodeoxynucleotides codant pour des 
residus contigus localises de part et d'autres de la sequence a amplifier. Les fragments amplifies sont ensuite clones 
dans des vecteurs du type M13 en vue de leur verification par sequencage en utilisant soit les amorces universelles 
situees de part et d'autre du multisite de clonage, soit des oligodeoxynucleotides specifiques de la region amplifiee du 
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gene du vWF dont la sequence de ptusieurs isomorphes est connue [Sadler J. E. et aL, Proc. Natl. Acad. Sci. 82 (1985) 
6394-6398; Verweij C.L. et al., EMBO J. 5 (1986) 1839-1847; Shelton-lnloes B.B. et ah, Biochemistry 25 (1986) 
3164-3171 ; Bonthron D. et al., Nucleic Acids Res. 17 (1986) 7125-7127]. Ainsi, I 'amplification PCR du plasmide pET- 
8c52K avec les oligodeoxynucleotides 5-CCCGGGAT CCCTTAGG CTTAACCTGTGAAGCCTGC-3' (Sq1969, le site 

5 Mstll est souligne) et 5'-CCCGGGATC CAAGCTTA GACTTGTGCCATGTCG-3' (Sq2029, le site Hind lll est souligne) 
genere un fragment de restriction Mstll- Hind lll incluant les residus Thr470 a Val71 3 du vWF (SEQ ID n° 2). La ligature 
de ce fragment avec le fragment de restriction Hindi I l-Mstl I correspondent a la totalite du gene codant pour la SAH a 
I'exception des trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction Hind lll 
comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1 , panneau A), imme- 

10 diatement precedee de la region d'exportation "prepro" de la SAH. Ce fragment de restriction est clone dans I'orientation 
productive et dans le site Hind lll du plasmide pYG105, ce qui genere le plasmide depression pYG1248 (SAH- 
VWF470-713). 

E.7.1.2. Variants moleculaires. 

15 

[0049] Dans un autre mode de realisation, le site de liaison du vWF est un peptide incluant les residus Thr470 a 
Asp498 du vWF mature. Cette sequence inclus le peptide G10 (Cys474-Pro488) decrit par Mori et al. [J. Biol. Chem. 
263 (1988) 17901-17904] et capable d'antagoniser interaction du vWF humain a la GP1b des plaquettes humaines. 
La sequence correspondant au peptide G10 est d'abord incluse dans un fragment de restriction Mstll- Hind lll (Figure 

20 4, panneau B), par exemple par amplification PCR du plasmide pET-8c52K avec les oligodeoxynucleotides Sq1969 
et 5'-CCCGGGATCC AAGCTT AGTCCTCCACATACAG-3' (Sq1970, le site Hindlll est souligne), ce qui genere un frag- 
ment de restriction Mstll- Hind lll incluant le peptide G10, et dont la sequence est: 5- CCTTAGGC TTAACCTGTGAA- 
GCCTGCCAGGAGCCGGGAGGCCTGGTGGTGCCTCCCACAGATGCCCCGGTGAGCCCCAC- 
C ACTCTGTATGTG GAG G AC TAAGCTT -3' (la sequence codant pour le peptide G10 est en caracteres gras). La liga- 

25 ture de ce fragment avec le fragment de restriction Hind lll-Mstll correspondant a la totalite du gene codant pour la 
SAH. a J'exception des trois.acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction 
Hind lll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), 
immediatement precedee de la region d'exportation "prepro" de la SAH. Ce fragment de restriction est clone dans 
I'orientation productive dans le site Hind lll du plasmide pYG105, ce qui genere le plasmide d'expression pYG1214. 

30 [0050] Dans un autre mode de realisation, le site de liaison du vWF a la GP1b est directement concu a I'aide d'oli- 
godeoxynucleotides synthetiques, et par exemple les oligodeoxynucleotides 5 -TTAGGCCTCTGTGACCTTGCCCC- 
TGAAGCCCCTCCTCCTACTCTGCCCCCCTAAGCTTA-3' et 5'-G ATCTAAGCTTAGG G GG G C AG AGTAG G AG- 
GAGGGGCTTCAGGGGCAAGGTCACAGAGGCC-3'. Ces oligodeoxynucleotides ferment en s'appariant un fragment 
de restriction Mstll-Bajll incluant le fragment Mstll- Hind lll (Figure 4, panneau C) correspondant au peptide D5 defini 

35 par les residus Leu694 a Pro708 du vWF. La ligature du fragment Mstll -Hind lll avec le fragment de restriction Hind lll- 
Mst ll correspondant a la totalite du gene codant pour la SAH a I'exception des trois acides amines les plus C-terminaux 
(cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un gene hybride codant pour une proteine 
chimere du type SAH-PEPTIDE (Figure 1, panneau A), immediatement precedee de la region d'exportation "prepro" 
de la SAH. Ce fragment de restriction est clone dans I'orientation productive dans le site Hind lll du plasmide pYG105, 

40 ce qui genere le plasmide d'expression pYG1206. 

[0051] Des variants utiles du plasmide pET-8c52K sont deletes par mutagenese dirigee entre les peptides G10 et 
D5, par exemple des sites de fixation au collagene, et/ou a I'heparine, et/ou a la botrocetine, et/ou aux sulfatides et/ 
ou a la ristocetine. Un exemple est le plasmide pMMB9 delete par mutagenese dirigee entre les residus Cys509 et 
Ile662. L'amplification PCR de ce plasmide avec les oligodeoxynucleotides Sq1969 et Sq2029 genere un fragment de 

45 restriction Mstll -Hind lll (Figure 4, panneau D) incluant les residus Thr470 a Tyr508 et Arg663 a Val713 et en particulier 
les peptides G10 et D5 du vWF et delete en particulier de son site de fixation au collagene localise entre les residus 
Glu542 et Met622 [Roth GJ. et al. Biochemistry 25 (1986) 8357-8361]. La ligature de ce fragment avec le fragment de 
restriction Hind lll-Mstll correspondant a la totalite du gene codant pour la SAH a I'exception des trois acides amines 
les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un gene hybride codant 

50 pour une proteine chimere du type SAH-PEPTIDE (Figure 1 , panneau A), immediatement precedee de la region d'ex- 
portation "prepro" de la SAH. Ce fragment de restriction est clone dans Torientation productive dans le site Hind lll du 
plasmide pYG105, ce qui genere le plasmide d'expression pYG1223. 

[0052] Dans d'autres modes de realisation, ['utilisation des techniques combinees de mutagenese dirigee et d'am- 
plification PCR permet de generer a volonte des variants du fragment de restriction Mstll- Hind lll du panneau A de la 
55 Figure 4 mais deletes d'un ou plusieurs sites de fixation aux sulfatides et/ou a la botrocetine et/ou a I'heparine et/ou 
au collagene, et/ou substitue par tout residu implique dans I'emergence de pathologies de type MB associee au vWF. 
[0053] Dans d'autres variants utiles du plasmide pET-8c52K des mutations sbnt introduces, par exemple par muta- 
genese dirigee, pour remplacer ou supprimer tout ou partie de I'ensemble des cysteines presentes aux positions 471 , 
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474, 509 et 695 du vWF humain. Des exemples particuliers sont les plasmides p5E et p7E dans lesquels les cysteines 
presentes aux positions 471 et 474 d'une part et aux positions 471 , 474, 509 et 695 d'autre part ont ete respectivement 
rem places par des residus glycine. L'amplification PCR de ces plasmides avec les oligodeoxynucleotides Sq2149 
(5-CCCGGGATC CCTTAGG CTTAACCGGTGAAGCCGGC-3', le site Mstll est souligne) et Sq2029 permet de generer 

5 des fragments de restriction Mstll-Hindlll incluant les residus Thr470 a Val713 du vWF naturel a I'exception qu'au 
moins les residus cysteine aux positions 471 et 474 ont ete mutes en des residus glycine. La ligature de ces fragments 
avec le fragment de restriction Hindi 1 1 -Mstll correspondant a la totalite du gene codant pour la SAH a I'exception des 
trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere un fragment de restriction Hind lll comportant un 
gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), immediatement pre- 

10 cedee de la region d'exportation "prepro" de la SAH. Ces fragments de restriction sont clones dans I'orientation pro- 
ductive dans le site Hind lll du plasmide pYG105, ce qui genere les plasmides d'expression pYG1283 (chimere SAH- 
VWF470-713, C471G, C474G) et pYG1279 (chimere SAH-vWF470-713, C471G, C474G, C509G, C695G). 
[0054] D'autres mutations particulierement utiles concernent au moins un residu implique dans des pathologies de 
type MB associees au vWF (augmentation de I'affinite intrinseque du vWF pour la GP1b), comme les residus Arg543, 

15 Arg545, Trp550, Val551 , Val553, Pro574 ou Arg578 par exemple. Les techniques de recombinaison genetique in vitro 
permettent egalement d'introduire a volonte un ou des residus supplementaires dans la sequence du vWF et par 
exemple une methionine sumumeraire entre les positions Asp539 et Glu542. 

E.7.2. Fragments antagonistes de la fixation du vWF au sous endothelium. 

20 

[0055] Dans un mode de realisation particulier, les sites de liaison du vWF aux composants du tissu sous-endothelial, 
et par exemple du collagene, sont generes par amplication PCR du plasmide pET-8c52K, par exemple avec les oli- 
godeoxynucleotides Sq2258 (5-GGA TCCTTAGG GCTG-TGCAGCAGGCTACTGGACCTGGTC-3', le site Mstll est 
souligne) et Sq2259 (5-GAATT CMGCTTA ACAGAGGTAGCTAACGATCTCGTCCC-3', le site Hindlll est souligne), 

25 ce qui genere un fragment de restriction Mstll -Hind lll codant pour les residus Cys509 a Cys695 du vWF naturel. Des 

variants moleculaires de deletion ou modifies sont egalement generes qui com portent toute combinaison souhaitable 

entre les sites de fixation du vWF aux sulfatides et/ou a la botrocetine et/ou a I'heparine et/ou au collagene et/ou tout 
residu responsable d'une modification de I'affinite du vWF pour la GP1b (pathologies de type II associee au vWF). 
Dans un autre mode de realisation, le domaine capable de se fixer au collagene peut egalement provenir du fragment 

30 du vWF compris entre les residus 911 et 1114 et decrit par Pareti et al. [J. Biol. Chem. (1987) 262: 13835-13841]. La 
ligature de ces fragments avec le fragment de restriction Hindi! I-Mstll correspondant a la totalite du gene codant pour 
la SAH a I'exception des trois acides amines les plus C-terminaux (cf. SEQ ID n° 1) genere des fragments de restriction 
Hind lll comportant un gene hybride codant pour une proteine chimere du type SAH-PEPTIDE (Figure 1, panneau A), 
immediatement precedee de la region d'exportation "prepro" de la SAH. Ces fragments de restriction sont clones dans 

35 I'orientation productive dans le site Hind lll du plasmide pYG1 05, ce qui genere les plasmides d'expression correspon- 
dants, et par exemple le plasmide pYG1277 (SAH-vWF509-695). 

E.7.3. Purification et caracterisation moleculaire des chimeres entre SAH et vWF. 

40 [0056] Les chimeres presentes dans les sumageants de culture correspondant a la souche CBS 293.91 transformee, 
par exemple par les plasmides d'expression selon les exemples E.7.1. et E.7.2. , sont caracterisees dans un premier 
temps a I 'aide d'anticorps specifiques de la partie SAH et de la partie vWF. Les resultats des Figures 5 a 7 demontrent 
que la levure K. lactis est capable de secreter des proteines chimeres entre la SAH et un fragment du vWF, et que ces 
chimeres sont immunologiquement reactives. II peut etre egalement souhaitable de purifier certaines de ces chimeres. 

45 La culture est alors centrifugee (1 0000 g, 30 min), le sumageant est passe a travers un filtre de 0,22 mm (Mtllipore), 
puis concentre par ultrafiltration (Amicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. 
Le concentrat obtenu est alors dialyse contre une solution de Tris HCI (50 mM pH 8) puis purifie sur colonne. Par 
exemple, le concentrat correspondant au sumageant de culture de la souche CBS 293.91 transformee par le plasmide 
pYG1206 est purifiee par chromatographie d'affinite sur Bleu-Trisacryl (IBF). Une purification par chromatographie 

50 d'echange d'ions peut egalement etre utilisee. Par exemple dans le cas de la chimere S AH- vWF4 70-71 3, le concentrat 
obtenu apres ultrafiltration est dialyse contre une solution de Tris HCI (50 mM pH 8), puis depose par fractions de 20 
ml sur une colonne (5 ml) echangeuse de cations (S Fast Flow, Pharmacia) equilibree dans le meme tampon. La 
colonne est alors lavee plusieurs fois par la solution de Tris HCI (50 mM pH 8) et la proteine chimere est alors eluee 
de la colonne par un gradient (0 a 1 M) de NaCI. Les fractions contenant la proteine chimere sont alors reunies et 

55 dialysees contre une solution de Tris HCI 50 mM (pH 8) puis redeposees sur colonne S Fast Flow. Apres elution de la 
colonne, les fractions contenant la proteine sont reunies, dialysees contre de I'eau et lyophilisees avant caracterisation: 
par exemple, le sequencage (Applied Biosystem) de la proteine [SAH-vWF470-704 C471G, C474G] secretee par la 
levure CBS 293.91 donne la sequence N-terminale attendue de la SAH (Asp-Ala-His...), demontrant une maturation 
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correcte de la chimere immediatement en C-terminal du doublet de residus Arg-Arg de la region "pro" de la SAH (SEQ 
ID n° 1). Le caractere essentiellement monomerique des proteines chimeres entre SAH et vWF est egalement confirme 
par leur profil d'elution sur colonne TSK 3000 [Toyo Soda Company, equilibree par une solution de cacodylate (pH 7) 
contenant 0,2 M de Na 2 S04] : par exemple la chimere [SAH-vWF 470-704 C471G, C474G] se comporte dans ces 
5 conditions comme une proteine de poids moleculaire apparent de 95 kDa demontrant son caractere monomerique. 

EXEMPLE 8 : CHIMERES DERIVEES DE L'UROKINASE 

E.8.1. Constructions. 

10 

[0057] Un fragment correspondant au fragment amino-terminal de I'urokinase (ATF: domaine EGF-like + domaine 
kringle) peut etre obtenu a partir de TARN messager correspondant des cellules de certains carcinome humain, par 
exemple en utilisant le kit RT-PCR distribue par Pharmacia. Un fragment de restriction Mstll -Hind lll incluant I'ATF de 
I'urokinase humaine est donne SEQ ID n° 3. La ligature du fragment Hindi I l-Mstl I du plasmide pYG404 avec ce fragment 

15 Mstll- Hind lll permet de generer le fragment Hindlll du plasmide pYG1341 qui code pour une proteine chimdre dans 
laquelle la molecule de SAH est genetiquement couplee a I'ATF (SAH-UK1->135). De facon similaire, le plasmide 
pYG1340 contient un fragment Hind lll codant pour une chimere composee de la SAH immediatement suivi par les 46 
premiers residus de I'urokinase humaine (SAH-UK1->46, cf. SEQ ID n° 3). Le clonage dans I'orientation productive 
du fragment de restriction Hind lll du plasmide pYG1340 (SAH-UK1->46) dans le site Hind lll des plasmides pYG105 

20 (LAC4 ) et pYG106 (PGK) genere les plasmides d'expression pYG1343 et pYG1342, respectivement. De facon simi- 
laire, le clonage dans I'orientation productive du fragment de restriction Hind lll du plasmide pYG1341 (SAH-UK1->135) 
dans le site Hind lll des plasmides pYG105 (LAC4) et pYG106 (PGK) genere les plasmides d'expression pYG1345 et 
pYG1344, respectivement. 

25 E-8.2. Secretion des hybrides. 



[0058] Apres selection sur milieu riche supplements en G418 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature des proteines chimeres SAH-UK. Quelques clones correspondant a la souche K. lactis CBS 
293.91 transformee par les plasmides d'expression selon I'exemple E.9. 1 . sont mis a incuber en milieu liquide complet 
30 selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant comme anticorps primaires 
un serum polyclonal de lapin dirige contre I'albumine humaine ou contre I'urokinase humaine. Les resultats de la Figure 
9 demon trent que les proteines hybrides SAH-UK1->46 et SAH-UK1->135 sont particulierement bien secretees par la 
levure Kluyveromyces. 

35 

E.8.3. Purification des chimeres entre SAH et urokinase. 

[0059] Apres centrifugation d'une culture de la souche CBS 293.91 transformee par les plasmides d'expression selon 
I'exemple E.8.1. , le sumageant de culture est passe a travers un filtre de 0,22 mm (Mi Hi pore), puis concentre par 

40 ultrafiltration (Amicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. Le concentrat 
obtenu est alors ajuste a 50 mM Tris HCI a partir d'une solution stock de Tris HC1 1 M (pH 7), puis depose par fractions 
de 20 ml sur une colonne (3 ml) echangeuse d'anions (D-Zephyr, Sepracor) equilibree dans le meme tampon. La 
proteine chimere (SAH-UK1->46 ou SAH-UK1->135) est alors eluee de la colonne par un gradient (0 a 1 M) de NaCI. 
Les fractions contenant la proteine chimere sont alors reunies et dialysees contre une solution de Tris HCI 50 mM (pH 

45 6) et redeposees sur colonne D-Zephyr equilibree dans le meme tampon. Apres elution de la colonne, les fractions 
contenant la proteine sont reunies, dialysees contre de I'eau et lyophilisees avant caracterisation de leur activite bio- 
logique et notamment vis a vis de leur aptitude a deplacer I'urokinase de son recepteur cellulaire. 

EXEMPLE 9 : CHIMERES DERIVEES DU G-CSF 

50 

E.9.1. Constructions. 

E.9.1.1. Couplage en C-terminal de la SAH. 

55 [0060] Un fragment de restriction Mstll- Hind lll incluant la forme mature du G-CSF humain est genere, par exemple 
selon la strategie suivante : un fragment de restriction Kpn l -Hind lll est d'abord obtenu par la technique d'amplification 
enzymatique PCR en utilisant les oligodeoxynucleotides Sq2291 (5-CAAGGATC CAAGCTTC AGGGCTGCG- 
CAAGGTGGCGTAG-3', le site Hindlll est souligne) et Sq2292 (5'-CG GGGTACC TTAGGCTTAACCCCCCTGGGCCC- 
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TGCCAGC-3', le site Kpn l est souligne) comme amorce sur le plasmide BBG13 servant comme matrice. Le plasmide 
BBG13 comporte le gene codant pour la forme B (174 acides amines) du G-CSF mature humain, obtenu aupres de 
British Bio-technology Limited, Oxford, England. Le produit d'amplification enzymatique d'environ 550 nucleotides est 
ensuite digere par les enzymes de restriction Kpn l et Hindlll et clone dans le vecteur pUC19 coupe par les memes 
5 enzymes, ce qui genere le plasmide recombinant pYG1255. Ce plasmide est la source d'un fragment de restriction 
Mgtll -Hjnd lll permettant de fusionner le G-CSF immddiatement en aval de la SAH (chim£re SAH-G.CSF) et dont la 
sequence nucleotidique est donnee SEQ ID n° 4. 

[0061] II peut etre egalement souhaitable d'inserer un linker peptidique entre la partie SAH et G-CSF, par exemple 
pour permettre une meilleure presentation fonctionnelle de la partie transductrice. Un fragment de restriction Mstll- 

10 Hind lll est par exemple genere par substitution du fragment MstH -Apa l du plasmide pYG1255 par les oligodeoxynu- 
cleotides Sq2742 (5 , -TTAGGCTT AGGTGGTGGCGGTA CCCCCCTGGGCC-3\ les codons codant pour les residus gly- 
cine de ce linker particulier sont soulignes) et Sq2741 (S'-CAGGGGGGTACCGCCACCACCTAAGCC-S') qui forment 
en s'appariant un fragment Mst H- Apa l. Le plasmide ainsi genere comporte done un fragment de restriction Mstll -Hindlll, 
dont la sequence est identique a celle de la SEQ ID n° 4 a I'exception du fragment Mst H -Apa l. 

15 [0062] La ligature du fragment Hindi I l-Mst 1 1 du plasmide pYG404 avec le fragment Mstll-Hindlll du plasmide 
pYG1255 permet de generer le fragment Hindlll du plasmide pYG1259 qui code pour une proteine chimere dans 
laquelle la forme B du G-CSF mature est positionnee par couplage genetique en phase traductionnelle en C-terminal 
de la molecule de SAH (SAH-G.CSF). 

[0063] Un fragment de restriction Hindlll identique a I'exception du fragment MstH -Apa l peut egalement etre facile- 
20 ment gener6 et qui code pour une proteine chimere dans laquelle la forme B du G-CSF mature est positionnee par 
couplage genetique en phase traductionnelle en C-terminal de la molecule de SAH et d'un linker peptidique particulier. 
Par exemple ce linker est constitue de 4 residus glycine dans le fragment Hind lll du plasmide pYG1336 (chimere 
SAH-Gly 4 -G.CSF). 

[0064] Le fragment de restriction Hind lll du plasmide pYG1 259 est clone dans I'orientation productive et dans le site 
25 de restriction Hind lll du plasmide d'expression pYG105, ce qui genere le plasmide d'expression pYG1266 (SAH-G. 
CSF). Dans une autreexemplification, le clonage du fragment de restriction Hind lll du plasmide pYG1 259 dans I'orien- 
tation productive et dans le site Hind lll du plasmide pYG106 genere le plasmide pYG1267. Les plasm ides pYG1266 
et pYG1 267 sont isogeniques entre eux a I'exception du fragment de restriction Sall-Hindlll codant pour le promoteur 
LAC 4 de K. lactis (plasmide pYG1266) ou le promoteur PGK de S. cerevisiae (plasmide pYG1267). 
30 [0065] Dans une autre exemplification, le clonage dans I'orientation productive du fragment de restriction Hind lll du 
plasmide pYG1336 (chimere SAH-Gly 4 -G.CSF) dans le site Hind lll des plasmides pYG105 (LAC4) et pYG106 (PGK) 
genere les plasmides d'expression pYG1351 et pYG1352, respectivement. 

E.9.1 .2. Couplage en N-terminal de la SAH. 

35 

[0066] Dans un mode realisation particulier, les techniques combines de mutagenese dirigee et d'amplification PCR 
permettent de construire des genes hybrides codant pour une proteine chimere resultant du couplage traductionnel 
entre un peptide signal (et par exemple la region prepro de la SAH), une sequence incluant un gene ayant une activite 
G-CSF, et la forme mature de la SAH ou un de ses variants moleculaires (cf. chimere du panneau B, Figure 1). Ces 

40 genes hybrides sont preferentiellement bordes en 5' de I'ATG initiateur de traduction et en 3' du codon de fin de tra- 
duction par des sites de restriction Hind i 1 1. Par exemple I'oligodeoxynucleotide Sq2369 (5'-GTTCTACGCCACCTTGCG- 
CAGCC CGGTGGAGGCGGT GATGCACACAAGAGTGAGGTTGCTCATCGG-3', les residus soulignes (optionnels) 
correspondent dans cette chimere particuliere a un linker peptidique compost de 4 residus glycine) permet par muta- 
genese dirigee de mettre en phase traductionelle la forme mature du G-CSF humain du plasmide BBG13 immediate- 

45 ment en amont de la forme mature de la SAH, ce qui genere le plasmide intermediate A. De fagon similaire, ['utilisation 
de I'oligodeoxynucleotide Sq2338 [5 -CAGGGAGCTGGCAGGGCCCAGGGGGGTT CGACGAAACACACCCCTG- 
GAATAAGCCGAGCT-3' (brin non codant), les nucleotides complementaires aux nucleotides codant pour les premiers 
residus N-terminaux de la forme mature du G-CSF humain sont soulignes] permet par mutagenese dirigee de coupler 
en phase traductionnelle de lecture la region prepro de la SAH immediatement en amont de la forme mature du G-CSF 

so humain, ce qui genere le plasmide intermediaire B. On genere ensuite un fragment Hind lll codant pour une proteine 
chimere du type PEPTIDE-SAH (cf. Figure 1 , panneau B) en associant le fragment Hindi II -Sstl du plasmide B (jonction 
region prepro de la SAH + fragment N-terminal du G-CSF mature) avec le fragment Sstl-Hindl 1 1 du plasmide A Qonction 
G-CSF mature-(glycine) x4 -SAH mature]. Le plasmide pYG1301 contient ce fragment de restriction Hind lll particulier 
codant pour la chimere G.CSF-Gly 4 -SAH fusionn^e immediatement en aval de la region prepro de la SAH (SEQ ID 

55 n° 5). Le clonage dece fragment de restriction Hind lll dans I'orientation productive et dans le site Hind lll des plasmides 
pYG105 (LAC 4) et pYG106 (PGK) g<§nere les plasmides d'expression pYG1302 et pYG1303, respectivement. 
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E.9.2. Secretion des hybrides. 

[0067] Apres selection sur milieu riche supplements en G41 8 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature des proteines chimeres entre SAH et G-CSF. Quelques clones correspondant a la souche 

5 K. lactis CBS 293.91 transformee par les plasmides pYG1266 ou pYG1267 (SAH-G.CSF), pYG1302 ou pYG1303 (G. 
CSF-Gly 4 -SAH) ou encore pYG1351 ou pYG1352 (SAH-Gly 4 -G.CSF) sont mis a incuber en milieu liquide complet 
selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant com me anticorps primaires 
des anticorps polyclonaux de lapin diriges centre le G-CSF humain ou un serum polyclonal de lapin dirige contre 

10 I'albumine humaine. Les resultats de la Figure 12 demontrent que la proteine hybride SAH-G.CSF est reconnue a la 
fois par des anticorps diriges contre I'albumine humaine (panneau C) et le G-CSF humain (panneau B). Les resultats 
de la Figure 13 indiquent que la chimere SAH-Gly 4 -G.CSF (piste 3) est particulierement bien secretee par la levure 
Kluyveromyces , possiblement du fait que la presence du linker peptidique entre partie SAH et partie G-CSF est plus 
favorable a un repliement independant de ces 2 parties lors du transit de la chimere dans la voie secretaire. De plus 

15 la fusion N-terminale (G.CSF-Gly 4 -SAH) est egalement secretee par la levure Kluyveromyces (Figure 13, piste 1). 

E.9.3. Purification et caracterisation moleculaire des chimeres entre SAH et G-CSF. 

[0068] Apres centrifugation d'une culture de la souche CBS 293.91 transformee par les plasmides d'expression selon 
20 I'exemple E.9.1., le surnageant de culture est passe a travers un filtre de 0,22 mm (Millipore), puis concentre par 
ultrafiltration (Amicon) en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. Le concentrat 
obtenu est alors ajuste a 50 mM Tris HCI a partir d'une solution stock de Tris HC1 1 M (pH 6), puis depose par fractions 
de 20 ml sur une colonne (5 ml) echangeuse d'ions (Q Fast Flow, Pharmacia) equilibree dans le meme tampon. La 
proteine chimere est alors eluee de la colonne par un gradient (0 a 1 M) de NaCI. Les fractions contenant la proteine 
25 chimere sont alors reunies et dialysees contre une solution de Tris HCI-50 mM (pH 6) et redeposees sur colonne Q 
Fast Flow (1 ml) equilibree dans le meme tampon, Apres elution de la colonne, les fractions contenant la proteine sont 
reunies, dialysees contre de I'eau et lyophilisees avant caracterisation: parexemple, le sequencage (Applied Biosys- 
tem) de la proteine SAH-G.CSF secretee par la levure CBS 293.91 donne la sequence N-terminale attendue de la 
SAH (Asp-Ala-His...), demontrant une maturation correcte de la chimere immediatement en C-terminal du doublet de 
30 residus Arg-Arg de la region "pro" de la SAH (SEQ ID n° 1). 

EXEMPLE 10 : CHIMERES DERIVEES D'UNE IMMUNOGLOBULINS 

E.10.1. Constructions. 

35 

[0069] Un fragment Fv' peut etre construit par les techniques du genie genetique, et qui code pour les fragments 
variables des chaines lourdes et legeres d'une immunoglobuline (Ig), relies entre eux par un peptide linker [Bird et al., 
Science (1988) 242: 423 ; Huston etal., (1988) Proc. Natl. Acad. Sci.85: 5879]. Schematiquement, les regions variables 
(environ 120 residus) des chaines lourdes et legeres d'une Ig donnee sont donees a partir de I'ARN messager de 

to I'hybridome correspondant, par exemple en utilisant le kit RT-PCR distribue, par Pharmacia (Mouse ScFv Module). 
Dans une seconde etape les regions variables sont genetiquement couplees par genie genetique par I'intermediaire 
d'un peptide de liaison synthetique et par exem pie le linker (GGGGS^. Un fragment de restriction Mstll -Hind l 1 1 incluant 
le fragment Fv' d'une immunoglobuline secretee par un hybridome murin est donne SEQ I D n° 6. La ligature du fragment 
Hind i ll-Mstll du plasmide pYG404 avec ce fragment Mstll- Hind lll permet de generer le fragment Hind i 1 1 du plasmide 

45 pYG1382 qui code pour une proteine chimere dans laquelle la molecule de SAH est genetiquement couplee au frag- 
ment Fv' de la SEQ ID n° 6 (chimere SAH-Fv'). Le clonage dans I'orientation productive du fragment de restriction 
Hindlll du plasmide pYG1382 dans le site Hindlll des plasmides pYG105 (LAC4) et pYG106 (PGK) genere les plas- 
mides d'expression pYG 1383 et pYG 1384, respectivement. 

50 E.10.2. Secretion des hybrides. 

[0070] Apres selection sur milieu riche supplements en G418 les clones recombinants sont testes pour leur capacite 
a secreter la forme mature de la proteine chimere SAH-Fv'. Quelques clones correspondant a la souche K. lactis CBS 
293.91 transformee par les plasmides pYG1383 ou pYG1384 (SAH-Fv') sont mis a incuber en milieu liquide complet 
55 selectif a 28°C. Les sumageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide a 8.5 %, soit 
directement par coloration du gel au bleu de coomassie, soit apres immunoblot en utilisant comme anticorps primaires 
un serum polyclonal de lapin dirige contre I'albumine humaine, ou directement incubee avec des anticorps biotinyies 
et diriges contre les immunoglobulines d'origine murine. Les resultats de la Figure 15 demontrent que la proteine 
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hybride SAH-Fv' est reconnue a la fois par des anticorps diriges contre I'albumine humaine (panneau C) et reagit avec 
des anticorps de chevre biotinyles immunologiquement reactife a I'encontre d'immunoglobulines de souris (panneau B). 

EXEMPLE 11 : ACTIVITE BIOLOGIQUE DES CHIMERES 

5 

E.11.1. Activite biologique in vitro. 
E. 11. 1.1. Chimeres entre SAH et vWF. 

10 [0071] L'activite antagoniste des produits est determinee par mesure de I'inhibition dose-dependante de lagglutina- 
tion des plaquettes humaines fixees au paraformaldehyde selon la methode decrite par Prior et al. [Bio/Technology 
(1992) 10: 66]. Les mesures se font dans un agregametre (PAP-4, Bio Data, Horsham, PA, USA) qui enregistre les 
variations au cours du temps de la transmission optique sous agitation a 37°C en presence de vWF, de botrocetine 
(8,2 mg/ml) et du produit a tester a differentes dilutions (concentrations). Pour chaque mesure, 400 ml (8x1 0 7 plaquet- 

15 tes) d'une suspension de plaquettes humaines stabilisees au paraformaldehyde (0,5 %, puis resuspendues en [NaCI 
(137 mM) ; MgCI 2 (1 mM) ; NaH 2 P0 4 (0,36 mM) ; NaHC0 3 (10 mM) ; KCI (2,7 mM) ; glucose (5,6 mM) ; SAH (3,5 mg/ 
ml) ; tampon HEPES (10 mM, pH 7,35)] sont preincubes a 37°C dans la cuve cylindrique (8,75 x 50 mm, Wellcome 
Distriwell, 159 rue Nationale, Paris) de I'agregametre pendant 4 min puis sont additionnes de 30 ml de la solution du 
produit a tester a differentes dilutions dans du vehicule de formulation apyrogene [mannitol (50 g/l) ; acide citrique (192 

20 mg/1) ; L-lysine monochlorhydratee (182,6 mg/l) ; NaCI (88 mg/l) ; pH ajuste a 3,5 par addition de NaOH (1M)], ou de 
vehicule de formulation uniquement (essai controle). La suspension resultante est alors incubee pendant 1 min a 37°C 
et on ajoute 12,5 ml de vWF humain [American Bioproducts, Parsippany, NJ, USA; 11 % d'activite von Willebrand 
mesuree selon les recommandations d'utilisation du PAP-4 (Platelet Aggregation Profiler*) a I'aide de plaquettes fixees 
au formaldehyde (2x10 5 plaquettes/ml), de plasma humain contenant de 0 a 100 % de vWF et de ristocetine (10 mg/ 

25 ml, cf. p. 36-45 : vW Program™] que Ton incube a 37°C pendant 1 min avant d'ajouter 12,5 ml de la solution de 

botrocetine [purifiee a partir de venin lyophilise de Bothrops jararaca (Sigma), selon le protocole decrit par Sugimoto 

et al., Biochemistry (1991) 266 : 18172]. L'enregistrement de la lecture de la transmission en fonction du temps est 
alors realisee pendant 2 min sous agitation a I'aide d'un barreau aimante (Wellcome Distriwell) place dans la cuve et 
sous une agitation magnetique de 1100 tr/min assuree par I'agregametre. La variation moyenne de la transmission 

30 optique (n 3 5 pour chaque dilution) au cours du temps est done une mesure de I'aggluti nation plaquettaire due a la 
presence de vWF et de botrocetine, en I'absence ou en presence de concentrations variables du produit a tester. A 
partir de tels enregistrements, on determine alors le % d'inhibition de Pagglutination plaquettaire due a chaque con- 
centration de produit et on trace la droite donnant le % d'inhibition en fonction de I'inverse de la dilution de produit en 
echelle log-log. La CI50 (ou concentration de produit provoquant 50 % d'inhibition de I'agglutination) est alors deter- 

35 minee sur cette droite. Le Tableau de la Figure 16 compare les CI50 de quelques unes des chimeres SAH-vWF de la 
presente invention et demontre que certaines d'entre elles sont de meilleurs antagonistes de I'agglutination plaquettaire 
que le produit RG 12986 decrit par Prior et al. [Bio/Technology (1992) 10: 66] et inclus dans les essais a titre de valeur 
etalon. Des tests identiques de I'inhibition de I'agglutination de plaquettes humaines en presence de vWF de plasma 
de pore (Sigma) permet en plus dedemontrerque certains des hybrides de la presente invention, et notamment certains 

40 variants de type IIB, sont de tres bons antagonistes de I'agglutination plaquettaire en I'absence de co-facteurs de type 
botrocetine. L'antagonisme botrocetine-independant de ces chimeres particulieres peut egalement etre demontre selon 
le protocole initialement decrit par Ware et al. [Proc. Natl. Acad. Sci. (1991) 88: 2946] par deplacement de I'anticorps 
monoclonal 125 I-LJ-IB1 (10 mg/ml), un inhibiteur competitif de la fixation du vWF sur la GPlb plaquettaire [Handa M. 
et al., (1986) J. Biol. Chem. 261: 12579] apres 30 min d'incubation a 22°C en presence de plaquettes fraiches (10 8 

45 plaquettes/ml). 

E.11.1.2. Chimeres entre SAH et G-CSF. 

[0072] Les chimeres purifiees sont testees pour leur capacite a permettre la proliferation in vitro de la lignee murine 
50 IL3-dependante NFS60, par mesure de incorporation de thymidine tritiee essentiellement selon le protocole decrit 
par Tsuchiya et al. (Proc. Natl. Acad. Sci. (1986) 83 7633]. Pour chaque chimere, les mesures sont realisees entre 3 
et 6 fois dans un test trois points (trois dilutions du produit) dans une zone ou la relation entre quantite de produit actif 
et incorporation de thymidine marquee (Amersham) est lineaire. Dans chaque plaque de microtitration, l'activite d'un 
produit reference constitue de G-CSF humain recombinant exprime dans des cellules mammiferes est egalement 
55 systematiquementincorpore. Les resultats de la Figure 17 demontrent que la chimere SAH-G.CSF(pYG 1266) secretee 
par la levure Kluy veromyces et purifiee selon I'exemple E.9.3. est capable in vitro de transduire un signal de proliferation 
cellulaire pour la lignee NFS60. Dans ce cas particulier, l'activite specifique (cpm/molarite) de la chimere est environ 
7 fois plus faible que celle du G-CSF reference (non couple). 
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E.11.2. Activite biologique in vivo. 

[0073] L'activite de stimulation des chimeres SAH/G-CSF sur la granulopoiese in vivo est testee apres injection sous- 
cutanee chez le rat (Sprague-Dawley/CD, 250-300 g, 8-9 semaines) et comparee a celle du G-CSF reference exprime 

5 a partir de cellules de mammifere. Chaque produit, teste a raison de 7 animaux, est injecte par voie sous-cutanee en 
region dorso-scapulaire a raison de 100 ml pendant 7 jours consecutifs (J1-J7). 500 ml de sang sont receuillis aux 
jours J-6, J2 (avant la 2 feme injection), J5 (avant la 5 feme injection) et J8, et une numeration sanguine est effectuee. 
Dans ce test, Tactivite specifique (unites de neutropoiese/mole injectee) de la chimere SAH-G.CSF (pYG1266) est 
identique a celle du G-CSF reference (Figure 18). Puisque cette chimere particuliere possede in vitro une activite 

10 specifique 7 fois plus faible que celle du G-CSF reference (Figure 1 7), il est done demontre que le couplage genetique 
du G-CSF sur la SAH en modifie favorablement les proprietes pharmacocinetiques. 

LISTE DE SEQUENCES 



15 



20 



25 



45 



[0074] 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1859 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc - 

(iii) HYPOTHETIQUE: NON 
30 (iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

35 (B) EMPLACEMENT: 26..1855 

(D) AUTRES RENSEIGNEMENTS: /product= "Chimere de type SAH-Peptide" 

(ix) CARACTERISTIQUE ADDITIONELLE: 

40 (A) NOM/CLE: misc_feature 

(B) EMPLACEMENT: 1842..1848 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Mst II" 



(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 750 paires de bases 

(B) TYPE: acide nucleique 

50 (C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
55 (iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 
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(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3.J46 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-terde la chimere SAH-vWF470" 
(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 423 pairesde bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..419 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C^ter de la chimere SAH-UK1-135" 
(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 541 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..S36 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-terde la chimere SAH-G.CSF" 
(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2455 paires de 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
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(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
5 (ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..2389 

(D) AUTRES RENSEIGNEMENTS: /product "Chimera G.CSF-Gly4-SAH en aval region prepro de SAH" 
CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc_recomb 

(B) EMPLACEMENT: 620..631 

15 (D) AUTRES RENSEIGNEMENTS: /standard_name= "Linker PolyGly" 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc feature 
20 (B) EMPLACEMENT: 106..111 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Apa I" 

(2) INFORMATION POUR LA SEQ ID NO: 6: 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 756 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 
30 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 

35 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

40 (A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3.. 752 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-Fv'" 
(ix) CARACTERISTIQUE ADDITIONELLE: 

45 

(A) NOM/CLE: misc_recomb 

(B) EMPLACEMENT: 384..428 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Linker synthetique" 
so LISTE DE SEQUENCES 
[0075] 

(1) INFORMATION GENERALE: 

55 

(i) DEPOSANT: 

(A) NOM: RHONE-POULENC RORER SA 



10 

(ix) 
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40 



(B) RUE: 20, avenue Raymond ARON 

(C) VILLE: ANTONY 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92165 

(ii) TITRE DE L' INVENTION: NOUVEAUX POLYPEPTIDES BIOLOGIQUEMENT ACTIFS, LEUR PREPARA- 
TION ET COMPOSITION PHARMACEUTIQUE LES CONTENANT 

(iii) NOMBRE DE SEQUENCES: 6 

(iv) FORME LISIBLE PAR ORDINATEUR: 



(A) TYPE DE SUPPORT: Tape 

(B) ORDINATEUR: IBM PC compatible 

15 (C) SYSTEME D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

20 (j) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1859 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 
25 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 

30 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE: 

35 (A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..1855 

(D) AUTRES RENSEIGNEMENTS: /product= "Chimere de type SAH-Peptide" 



(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc_feature 

(B) EMPLACEMENT: 1842.. 1848 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Mst II" 
45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 



50 



AAGCTTTACA ACAAATATAA AAACA ATG AAG TGG GTA ACC TTT ATT TCC CTT 52 

Met Lys Trp Val Thr Phe lie Ser Leu 
1 5 



CTT TTT CTC TTT AGC TCG GCT TAT TCC AGG GGT GTG TTT CGT CGA GAT 100 
Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Asp 
10 15 20 ' 25 
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GCC AAA CAG AGA CTC AAG TGT GCC ACT CTC CAA AAA TTT GGA GAA AGA 724 
Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg 
220 225 230 



GCT TTC AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT CCC AAA 772 
Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe Pro Lys 
235 240 245 



GCT GAG TTT GCA GAA GTT TCC AAG TTA GTG ACA GAT CTT ACC AAA GTC 820 
Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val 
250 255 260 265 



CAC ACG GAA TCC TGC CAT GGA GAT CTG CTT GAA TGT GCT GAT GAC AGG 868 
His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg 
270 275 280 



GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC TCC AGT 916 
Ala Asp Leu Ala Lys Tyr He Cys Glu Asn Gin Asp Ser He Ser Ser 
285 290 295 



AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC 964 
Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys 
300 305 310 



ATT GCC GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG CCT TCA TTA 1012 
He Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser lieu 
315 320 325 



GCT GCT GAT TTT GTT GAA AGT AAG GAT GTT TGC AAA AAC TAT GCT GAG 1060 
Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu 
330 335 340 345 



GCA AAG GAT GTC TTC CTG GGC ATG TTT TTG TAT GAA TAT GCA AGA AGG 1 1 08 

Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg 
350 355 360 



CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT GCC AAG ACA TAT 1 1 56 

His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr 
365 370 375 



GAA ACC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT CCT CAT GAA TGC 1204 
Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys 
380 385 390 
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TAT GCC AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG CCT CAG 1252 
Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin 
395 400 405 



AAT TTA ATC AAA CAA AAT TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC 1 300 
Asn Leu lie Lys Gin Asn Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr 
410 415 420 425 



AAA TTC CAG AAT GCG CTA TTA GTT CGT TAC ACC AAG AAA GTA CCC CAA 1 348 

Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gin 
430 435 440 



GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA AAA GTG 1396 
Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val 
445 450 455 



GGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC TGT GCA 1444 
Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala 
460 465 470 



GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG CAT GAG 1492 
Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu 
475 480 485 



AAA ACG CCA GTA AGT GAC AGA GTC ACC AAA TGC TGC ACA GAA TCC TTG 1540 
Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu 
490 495 500 505 



GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG GAA GTC GAT GAA ACA TAC 1 588 

Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr 
510 515 520 

40 

GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC CAT GCA GAT ATA 1636 
Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp He 
525 530 535 

45 

TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT 1684 
Cys Thr Leu Ser Glu Lys Glu" Arg Gin He Lys Lys Gin Thr Ala Leu 
540 545 550 

50 

GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA 1732 
Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys 
555 560 565 

55 

GCT GTT ATG GAT GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT 1780 
Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala 
570 575 580 585 
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GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG GGT AAA AAA CTT GTT GCT 1828 
Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala 
590 595 600 



GCA AGT CAA GCT GCC TTA GGC TTA (NNN)p TAAGCTT 1859 

Ala Ser Gin Ala^Ala Leu Gly Leu PEPTIDE 
605 ~ 610 



(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 750 pairesde bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

i 

(ix) CARACTERISTJQUE ADDITIONELLE: ..... - 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..746 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-VWF470'' 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



CC TTA GGC TTA ACC TGT GAA GCC TGC CAG GAG CCG GGA GGC CTG GTG 47 
Leu Gly Leu Thr Cys Glu Ala Cys Gin Glu Pro Gly Gly Leu Val 
1 5 10 15 



GTG CCT CCC ACA GAT GCC CCG GTG AGC CCC ACC ACT CTG TAT GTG GAG 9S 
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu 
20 25 30 



GAC ATC TCG GAA CCG CCG TTG CAC GAT TTC TAC TGC AGC AGG CTA CTG 143 
Asp lie Ser Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu 
35 40 45 



GAC CTG GTC TTC CTG CTG GAT GGC TCC TCC AGG CTG TCC GAG GCT GAG 191 
Asp Leu Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu 
50 55 60 



TTT GAA GTG CTG AAG GCC TTT GTG GTG GAC ATG ATG GAG CGG CTG CGC 239 
Phe Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg 
65 70 75 
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(A) LONGUEUR: 423 paires de 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: OUI 
(iii) ANTI-SENS: OUI 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..419 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-UK1-135' 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 



CC TTA GGC TTA AGC AAT GAA CTT CAT CAA GTT CCA TCG AAC TGT GAC 47 
Leu Gly Leu Ser Asn Glu Leu His Gin Val Pro Ser Asn Cys Asp 
15 10 15 



TGT CTA AAT GGA GG& ACA TGT GTG TCC AAC AAG TAC TTC TCC AAC ATT 95 
Cys Leu Asn Gly Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn lie 
20 25 30 



CAC TGG TGC AAC TGC CCA AAG AAA TTC GGA GGG CAG CAC TGT GAA ATA 143 
His Trp Cys Asn Cys Pro Lys Lys Phe Gly Gly Gin His Cys Glu lie 
35 40 45 



GAT AAG TCA AAA ACC TGC TAT GAG GGG AAT GGT CAC TTT TAC CGA GGA 191 
Asp Lys Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly 
50 55 60 



AAG GCC AGC ACT GAC ACC ATG GGC CGG CCC TGC CTG CCC TGG AAC TCT 239 
Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser 
65 70 75 



GCC ACT GTC CTT CAG CAA ACG TAC CAT GCC CAC AGA TCT GAT GCT CTT 287 
Ala Thr Val Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu 
80 85 90 95 



CAG CTG GGC CTG GGG AAA CAT AAT TAC TGC AGG AAC CCA GAC AAC CGG 335 
Gin Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg 
100 105 110 



AGG CGA CCC TGG TGC TAT GTG CAG GTG GGC CTA AAG CCG CTT GTC CAA 383 
Arg Arg Pro Trp Cys Tyr Val Gin Val Gly Leu Lys Pro Leu Val Gin 
115 120 125 
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GAG TGC ATG GTG CAT GAC TGC GCA GAT GGA AAA TAAGCTT 423 
Glu Cys Met Val His Asp Cys Ala Asp Gly Lys 
130 135 



(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 541 pairesde bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(ix) C ARACTE R I STl QUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..S36 

(D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-terde la chimere SAH-G.CSF" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 



CC TTA GGC TTA ACC CCC CTG GGC CCT GCC AGC TCC CTG CCC CAG AGC 47 
Leu Gly Leu Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser 
15 10 15 



TTC CTG CTC AAG TGC TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GGC 95 
Phe Leu Leu Lys Cys Leu Glu Gin Val Arg Lys lie Gin Gly Asp Gly 
20 25 30 



GCA GCG CTC CAG GAG AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC 143 
Ala Ala Leu Gin Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro 
35 40 45 



GAG GAG CTG GTG CTG CTC GGA CAC TCT CTG GGC ATC CCC TGG GCT CCC 191 
Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly lie Pro Trp Ala Pro 
50 55 60 



CTG AGC TCC TGC CCC AGC CAG GCC CTG CAG CTG GCA GGC TGC TTG AGC 239 
Leu Ser Ser Cys Pro Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser 
65 70 75 



CAA CTC CAT AGC GGC CTT TTC CTC TAC CAG GGG CTC CTG CAG GCC CTG 287 
Gin Leu His Ser Gly Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu 
80 85 90 95 
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10 



15 



20 



25 



30 



45 



GAA CGG ATA TCC CCC GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG 335 
Glu Gly lie Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu 
100 105 110 



GAC GTC GCC GAC TTT GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG 383 
Asp Val Ala Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu 
115 120 125 



GGA ATG GCC CCT GCC CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC 431 
Gly Met Ala Pro Ala Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe 
130 135 140 



GCC TCT GCT TTC CAG CGC CGG GCA GGA GGG GTC CTG GTT GCT AGC CAT 479 
Ala Ser Ala Phe Gin Arg Arg Ala Gly Gly Val Leu Val Ala Ser His 
145 150 155 



CTG CAG AGC TTC CTG GAG GTG TCG TAC CGC GTT CTA CGC CAC CTT GCG 527 
Leu Gin Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala 
160 165 170 175 



CAG CCC TGAAGCTT 543 
Gin Pro 



(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

35 (A) LONGUEUR: 2455 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

40 (ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
(ix) CARACTERISTIQUE ADDITIONELLE: 



(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 26..2389 

50 (D) AUTRES RENSEIGNEMENTS: /product= "Chimera G.CSF-Gly4-SAH en aval region prepro de SAH" 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: misc_recomb 
55 (B) EMPLACEMENT: 620. .631 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Linker PolyGly" 

(ix) CARACTERISTIQUE ADDITIONELLE: 
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(A) NOM/CLE: misc feature 

(B) EMPLACEMENT: 106..111 

(D) AUTRES RENSEIGNEMENTS: /standard_name= "Site Apa I" 
5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 



AAGCTTTACA ACAAATATAA AAACA ATG AAG TGG GTA ACC TTT ATT TCC CTT 52 

Met Lys Trp VaX Thr Phe lie Ser Leu 



CTT TTT CTC TTT AGC TCG GCT TAT TCC AGG GGT GTG TTT CGT CGA ACC 100 
Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val Phe Arc Arg Thr 
10 15 ~ 20 25 



CCC CTG GGC CCT GCC AGC TCC CTG CCC CAG AGC TTC CTG CTC AAG TGC 148 
Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu Lys Cys 
20 30 35 40 



TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GGC GCA GCG CTC CAG GAG 196 
Leu Glu Gin Val Arg Lys lie Gin Gly Asp Gly Ala Ala Leu Gin Glu 
45 50 55 



AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC GAG GAG CTG GTG CTG 244 
Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu 
60 65 70 



CTC GGA CAC TCT CTG GGC ATC CCC TGG GCT CCC CTG AGC TCC TGC CCC 292 
Leu Gly His Ser Leu Gly He Pro Trp Ala Pro Leu Ser Ser Cys Pro 
75 60 85 



40 



AGC CAG GCC CTG CAG CTG GCA GGC TGC TTG AGC CAA CTC CAT AGC GGC 
Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser Gin Leu His Ser Gly 
90 95 100 105 



340 



45 



CTT TTC CTC TAC CAG GGG CTC CTG CAG GCC CTG GAA GGG ATA TCC CCC 
Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu Glu Gly He Ser Pro 
110 115 120 



388 



50 



GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG GAC GTC GCC GAC TTT 
Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp Val Ala Asp Phe 
125 130 135 



436 



55 



GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG GGA ATG GCC CCT GCC 
Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala 
140 145 150 



484 
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10 



15 



20 



25 



30 



35 
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45 



50 



55 



CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC GCC TCT GCT TTC CAG 532 
Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gin 
155 160 165 



CGC CGG GCA GGA CGC GTC CTG GTT GCT AGC CAT CTG CAG AGC TTC CTG 580 
Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gin Ser Phe Leu 
170 175 180 185 



GAG GTG TCG TAC CGC GTT CTA CGC CAC CTT GCG CAG CCC GGT GGA GGC 628 
Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gin Pro Gly Gly Gly 
190 195 200 



GGT GAT GCA CAC AAG AGT GAG GTT GCT CAT CGG TTT AAA GAT TTG GGA 676 
Gly Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly 
205 210 215 



GAA GAA AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT GCT CAG TAT CTT 724 
Glu Glu Asn Phe Lys Ala Leu Val Leu lie Ala Phe Ala Gin Tyr Leu 
220 225 230 



CAG CAG TGT CCA TTT GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT 772 
Gin Gin Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr 
235 240 245 



GAA TTT GCA AAA ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC 820 
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp 
250 255 260 265 



AAA TCA CTT CAT ACC CTT TTT GGA GAC AAA TTA TGC ACA GTT GCA ACT 868 
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr 
270 275 280 



CTT CGT GAA ACC TAT GGT GAA ATG GCT GAC TGC TGT GCA AAA CAA GAA 916 
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gin Glu 
285 290 295 



CCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC CCA AAC 964 
Pro Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn Pro Asn 
300 305 310 



CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT 1012 
Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe 
315 320 325 
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CAT GAC AAT GAA GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC 1060 
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu He Ala 
330 335 340 345 



AGA AGA CAT CCT TAC TTT TAT GCC CCG GAA CTC CTT TTC TTT GCT AAA 1 1 08 

Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys 
350 355 360 



AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC CAA GCT GCT GAT AAA GCT 1 1 56 

Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala Ala Asp Lys Ala 
365 370 375 



GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG AAG GCT 1204 
Ala Cys Leu Leu Pro Lys Leu Asp Glu X*eu Arg Asp Glu Gly Lys Ala 
380 385 390 



TCG TCT GCC AAA CAG AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA 1252 
Ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly 
395 400 405 



GAA AGA GCT TTC AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT 1300 
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe - 
410 415 420 425 



CCC AAA GCT GAG TTT GCA GAA GTT TCC AAG TTA GTG ACA GAT CTT ACC 1348 
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr 
430 435 440 



AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT GAA TGT GCT GAT 1 396 

Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp 
445 450 455 



GAC AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC 1444 
Asp Arg Ala Asp Leu Ala Lys Tyr He Cys Glu Asn Gin Asp Ser lie 
460 465 470 



TCC AGT AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC 1 492 
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser 
475 480 485 



CAC TGC ATT GCC GAA GTG GAA AAT GAT GAG ATG OCT GCT GAC TTG CCT 1540 
His Cys He Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro 
490 495 500 ~ 505 

55 

TCA TTA GCT GCT GAT TTT GTT GAA AGT AAG GAT GTT TGC AAA AAC TAT 1588 
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr 
510 515 520 
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GCT GAG GCA AAG GAT GTC TTC CTG GGC ATG TTT TTG TAT GAA TAT GCA 1636 
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala 
525 530 535 



AGA AGG CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT GCC AAG 1684 
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys 
540 545 550 



ACA TAT GAA ACC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT CCT CAT * 1732 
Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His 
555 560 565 



GAA TGC TAT GCC AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG 1780 
Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu 
570 575 580 585 



CCT CAG AAT TTA ATC AAA CAA AAT TGT GAG CTT TTT GAG GAG CTT GGA 1828 
Pro Gin Asn Leu lie Lys Gin Asn Cys Glu Leu Phe Glu Gin Leu Gly 
590 595 600 



GAG TAC AAA TTC CAG AAT GCG CTA TTA GTT CGT TAC ACC AAG AAA GTA 1876 
Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val 
605 610 615 



CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA 1924 
Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly 
620 625 630 



AAA GTG GGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC 1972 
Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro 
635 640 645 



TGT GCA GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG 2020 
Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu 
650 655 660 665 



CAT GAG AAA ACG ~£CA GTA AGT GAC AGA GTC ACC AAA TGC TGC ACA GAA 2068 
His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu 
670 675 680 



TCC TTG GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG GAA GTC GAT GAA 2116 
Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu 
685 690 695 
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10 



15 



ACA TAC GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC CAT GCA 2164 
Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala 
700 705 710 



GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT 2212 
Asp lie Cys Thr Leu Ser Glu Lys Glu Arg Gin lie Lys Lys Gin Thr 
715 720 725 



GCA CTT GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA 2260 
Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin 
730 735 740 745 



20 



25 



30 



35 



50 



CTG AAA GCT GTT ATG GAT GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC 2308 
Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys 
750 755 760 



AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG GGT AAA AAA CTT 2356 
Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu 
765 770 775 



GTT GCT GCA AGT CAA GCT GCC TTA GGC TTA TAACATCACA TTTAAAAGCA 2406 
Val Ala Ala Ser Gin Ala Ala Leu Gly Leu 
780 785 



TCTCAGCCTA CCATGAGAAT AAGAG AAAGA AAATGAAGAT CAAAAGCTT 2455 



(2) INFORMATION POUR IA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

40 (A) LONGUEUR: 756 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

45 (jj) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 
(ix) CARACTERISTIQUE ADDITIONELLE: 



(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3..752 

55 (D) AUTRES RENSEIGNEMENTS: /product= "Fragment C-ter de la chimere SAH-F\T 

(ix) CARACTERISTIQUE ADDITIONELLE: 
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(A) NOM/CLE: misc recomb 

(B) EMPLACEMENT: 384..428 

(D) AUTRES RENSEIGNEMENTS: /standard name= "Linker synthetique" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 



CC TTA GGC TTA CAG GTG CAG CTC GAG CAG TCT GGA CCT GAG CTG GTG 47 
Leu Gly Leu Gin Val Gin Leu Glu Gin Ser Gly Pro Glu Leu Val 
w 1 5 10 15 



AAG CCT GGG GCC TCA GTG AAG ATT TCC TGC AAA GCT TCT GGC TAC GCA 95 
Lys Pro Gly Ala Ser Val Lys lie Ser Cys Lys Ala Ser Gly Tyr Ala 
20 25 30 

TTC AGT AGG TCT TGG ATG AAC TGG GTG AAG CAG AGG CCT GGA CAG GGT 143 
Phe Ser Arg Ser Trp Met Asn Trp Val Lys Gin Arg Pro Gly Gin Gly 
35 40 45 

20 

CTT GAG TGG ATT GGA CGG ATT TAT CCT GGA GAT GGA GAT ACC AAA TAC 1 91 

Leu Glu Trp lie Gly Arg lie Tyr Pro Gly Asp Gly Asp Thr Lys Tyr 
50 55 60 

25 

AAT GGG AAG TTC AAG GGC AAG GCC ACA CTG ACT GCG GAC AGA TCA TCC 239 
Asn Gly Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Arg Ser Ser 
65 70 75 

30 

AGC ACA GCC TAC ATG CAG CTC AGC AGC CTG ACC TCT GTG GGC TCT GCG 287 
Ser Thr Ala Tyr Met Gin Leu Ser Ser Leu Thr Ser Val Gly Ser Ala 
80 85 90 95 

35 

GTC TAT TTC TGT GCA AAA GAG AAC AAT AGG TTC GAC GAG AGG GGT TAC 335 
Val Tyr Phe Cys Ala Lys Glu Asn Asn Arg Phe Asp Glu Arg Gly Tyr 
100 105 110 

40 

TAT GCT ATG GAC TAC TGG GGC CAA GGG ACC ACG GTC ACC GTC TCC TCA 383 
Tyr Ala Met Asp Tyr Trp Gly Gin Gly Thr Thr Val Thr Val Ser Ser 
115 120 125 

45 

GGT GGC GGT GGC TCG GGC GGT GGT GGG TCG GGT GGC GGC GGA TCT AAC 431 
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asn 
130 135 140 

50 

ATT CAG TTG ACC CAG TCT CCA AAT TCC ATG TCC ACA TCA GTA GGA GAC 479 
lie Gin Leu Thr Gin Ser Pro Asn Ser Met Ser Thr Ser Val Gly Asp 
145 150 155 

55 
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AGG GTC AGC ATC ACC TGC AAG GCC AGT CAG GAT GTG GAT ACT TCT GTA 527 
Arg Val Ser He Thr Cys Lys Ala Ser Gin Asp Val Asp Thr Ser Val 
160 165 170 175 



GCC TGG TAT CAA CAG AAA CCA GGG CAA TCT CCT AAA CTA CTG ATT TAC 575 
Ala Trp Tyr Gin Gin Lys Pro Gly Gin Ser Pro Lys Leu Leu lie Tyr 
180 185 190 

10 



TGG GCA TCC ACC CGG CAC ACT GGA GTC CCT GAT CGC TTC ACA GGC AGT 623 
Trp Ala Ser Thr Arg His Thr Gly Val Pro Asp Arg Phe Thr Gly Ser 
195 200 205 

15 



GGA TCT GGG ACA GAT TTC ACT CTC ACC ATT AGC AAT GTG CAG TCT GAA 671 
Gly Ser Gly Thr Asp Phe Thr Leu Thr He Ser Asn Val Gin Ser Glu 
210 215 220 

20 



GAC TCG GCA GAT TAT TTC TGT CAG CAA TAT AGC AGC TAT CCG TGG ACG 719 
Asp Ser Ala Asp Tyr Phe Cys Gin Gin Tyr Ser Ser Tyr Pro Trp Thr- 
225 230 235 

25 



TTC GGT GGA GGG ACC AAG CTG GAG ATC AAA TAAGCTT 759 
Phe Gly Gly Gly Thr Lys Leu Glu He Lys 
240 245 250 



30 



Revendications 



35 1. Polypeptide recombinant comportant une partie active derivee d'un polypeptide ayant une activite therapeutique, 
genetiquement couplee a une album ine ou a un variant de Talcum ine, ledit variant de I'albumin conservant une 
haute demie-vie plasmatique, caracterise en ce que le polypeptide ayant une activite therapeutique est choisi 
parmi des hormones, des interferons, des interleukines, erythropoietine, G-CSF et I'insuline. 

40 2. Polypeptide selon la revendication 1 caracterise en ce que le polypeptide ayant une activite therapeutique est 
un polypeptide d'origine humaine. 

3. Polypeptide selon Tune des revendications 1 ou 2 caracterise en ce que la partie active presente une structure 
choisie parmi: 

45 

(a) la structure peptidique entiere ou, 

(b) un fragment de (a) ou une structure derivee de (a) par modification structurale (mutation, substitution 
addition et/ou deletion d'un ou plusieurs residus) et conservant une activite therapeutique. 

so 4. Polypeptide selon I'une des revendications 1 a 3 caracterise en ce que I'albumine ou le variant de I'albumine 
possede une structure choisi parmi: 



(a) I'albumine mature; 

(b) I'albumine; et 

(c) une structure derivee de (a) ou (b) par modification structurale (mutation, substitution, addition et/ou de- 
letion d'un ou plusieurs residus) et conservant une haute demie-vie plasmatique. 

5. Polypeptide selon I'une des revendications 1 a 4 caracterise en ce que le polypeptide comprend une methionine 
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N-terminale. 

6. Polypeptide selon Tune des revendications 1 a 5 caracterise en ce que le polypeptide comprend un peptide de 
jonction. 

5 

7. Polypeptide selon Tune des revendications 1 a 6 caracterise en ce que le polypeptide comprend un signal de 
secretion. 

8. Polypeptide selon la revendication 7 caracterise en ce que le signal de secretion est la sequence signal naturelle 
10 du polypeptide biologiquement actif. 

9. Polypeptide selon Tune des revendications 1 a 8 caracterise en ce que la partie active est couplee a I'extremite 
N-terminale de I'albumine. 

15 10. Polypeptide selon Tune des revendications 1 a 8 caracterise en ce que la partie active est couplee a I'extremite 
C-terminale de I'albumine. 

11. Polypeptide selon Tune des revendications 1 a 1 0 caracterise en ce que la partie active y est represents plusieurs 
fois. 

20 

12. Sequence nucleotidique codant pour un polypeptide selon Tune quelconque des revendications 1 a 11. 

13. Sequence nucleotidique selon la revendication 12 caracterisee en ce qu'elle comprend une sequence codant 
pour une sequence "leader" permettant la secretion du polypeptide exprime. 

25 

14. Cassette d'expression comprenant une sequence nucleotidique selon Tune des revendications 12 ou 13 sous le 
controle d'une region d'initiation de la transcription et eventuellement d'une region de terminaison de la transcrip- 
tion. 

30 15. Plasmide autoreplicatrf comportant une cassette d'expression selon la revendication 14. 

16. Cellule recombinante eucaryote ou procaryote dans laquelle a ete insere une sequence nucleotidique selon Tune 
des revendications 12 ou 13 ou une cassette d'expression selon la revendication 14 ou un plasmide selon la 
revendication 15. 

35 

17. Cellule recombinante selon la revendication 16 caracterisee en ce qu'il s'agit d'une levure, d'une cellule animale, 
d'un champignon ou d'une bacterie. 

18. Cellule recombinante selon la revendication 17 caracterisee en ce qull s'agit d'une levure. 

40 

19. Cellule recombinante selon la revendication 18 caracterisee en ce qu'il s'agit d'une levure du genre Saccharo- 
myces ou Kluyveromyces. 

20. Precede de preparation d'un polypeptide tel que defini dans Tune des revendications 1 a 11 caracterise en ce 
4$ que Ton cultive une cellule recombinante selon Tune des revendications 16 a 19 dans des conditions d'expression, 

et on recupere le polypeptide produit. 

21 . Composition pharmaceutique comprenant un ou plusieurs polypeptides selon Tune quelconque des revendications 
1 a 11 ou prepares par un procede selon la revendication 20. 

50 

22. Composition pharmaceutique comprenant une sequence nueleotidique selon I'une quelconque des revendications 
12 a 14 utilisable en therapie genique. 



55 Patentanspruche 



Rekombinantes Polypeptid mit einem von einem Polypetid mit therapeutischer Aktivitat erhaltenen aktiven Teil, 
der an ein Albumin oder eine Album in variante genetisch gekoppelt ist, wobei die Albuminvariante eine groBe 
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Plasma-Halbwertszeit konserviert, dadurch gekennzeichnet, dass das Polypeptid mit therapeutischer Aktivitat 
ausgewahlt ist aus Hormonen, Interferonen, Interleukinen, Erythropoitin, G-CSF und Insulin. 

2. Polypeptid nach Anspruch 1 t dadurch gekennzeichnet, dass das Polypeptid mit therapeutischer Aktivitat ein 
Polypeptid menschlichen Ursprungs ist. 

3. Polypeptid nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der aktive Teil eine Struktur aufweist, die 
ausgewahlt ist aus 

(a) einer vollstandigen Peptidstruktur oder 

(b) einem Fragment von (a) oder einer durch strukturelle Modifikation (Mutation, Substitution und/oder L6- 
schung von einem oder mehreren Rest(en)) und Konservierung der therapeutischen Aktivitat von (a) erhalte- 
nen Struktur. 

4. Polypeptid nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dass das Albumin oder die Albumin- 
variante eine Struktur aufweist, die ausgewahlt ist von 

(a) reifem Albumin, 

(b) Albumin; und 

(c) einer von (a) oder (b) durch strukturelle Modifikation (Mutation, Substitution, Addition und/oder Loschung 
von einem oder mehreren Reten) und Konservierung der hohen Plasma-Halbwertszeit erhaltenen Struktur. 

5. Polypeptid nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, dass das Polypeptid ein N-terminales 
Methionin aufweist. 

6. Polypeptid nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, dass das- Polypeptid ein Linkerpeptid 
aufweist. 

7. Polypeptid nach einem der Anspruche 1 bis 6, dadurch gekennzeichnet, dass das Polypeptid ein Sekretionssi- 
gnal aufweist. 

8. Polypeptid nach Anspruch 7, dadurch gekennzeichnet, dass das Sekretionssignal das naturliche Sekretionssi- 
gnal des biologisch aktiven Polypeptids ist. 

9. Polypeptid nach einem der Anspruche 1 bis 8, dadurch gekennzeichnet, dass der aktive Teil an den N-Terminus 
des Albumins gekoppelt ist. 

10. Polypeptid nach einem der Anspruche 1 bis 8, dadurch gekennzeichnet, dass der aktive Teil an den C-Terminus 
des Albumins gekoppelt ist. 

11. Polypeptid nach einem der Anspruche 1 bis 10, dadurch gekennzeichnet, dass der aktive Teil mehrere Male 
vorhanden ist. 

12. Nukleotidsequenz, welche ein Polypeptid nach einem der Anspruche 1 bis 11 kodiert. 

13. Nukleotidsequenz nach Anspruch 12, dadurch gekennzeichnet, dass sie eine Sequenz aufweist, die eine "Fuh- 
rer"-Sequenz kodiert, welche die Sekretion des expressivierten Polypeptids ermdglicht. 

14. Expressionskassette, welche eine Nukleotidsequenz nach einem der Anspruche 12 und 13 aufweist unter der 
Kontrolle eines Transkriptionsinitiierungsbereichs und optional eines Transkriptionsbeendigungsbereiches. 

15. Selbstreplizierendes Plasmid, welches eine Expressionskassette nach Anspruch 14 aufweist. 

16. Rekombinante eukaryotische oder prokaryotische Zelle, in welche eine Nukleotidsequenz nach Anspruch 12 oder 
13 oder eine Expressionskassette nach Anspruch 14 oder ein Plasmid nach Anspruch 15 eingesetzt ist. 

1 7. Rekom binante Zelle nach Anspruch 1 6, dadurch gekennzeichnet, dass es sich urn eine Hefezelle, eine Tlerzelle, 
eine Pilzzelle oder eine bakterielle Zelle handelt. 
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18. Rekombinante Zelle nach Anspruch 17, dadurch gekennzeichnet, dass es sich um eine Hefezelle handelt. 

19. Rekombinante Zelle nach Anspruch 18, dadurch gekennzeichnet, dass es sich um eine Zelle der Art Saccha- 
romyces oder Kluyveromyces handelt. 

5 

20. Verfahren zur Herstellung eines Polypeptides gemafc einem der Anspruche 1 bis 11, dadurch gekennzeichnet, 
dass eine rekombinante Zelle nach einem der Anspruche 16 bis 19 unter Expressionsbedingungen kultiviert wird 
und dass das Polypeptidprodukt geborgen wird. 

10 21. Pharmazeutische Zusammensetzung mit einem oder mehreren Polypeptiden nach einem der Anspruche 1 bis 11 
oder hergestellt durch ein Verfahren nach Anspruch 20. 

22. Pharmazeutische Zusammensetzung mit einer Nukleotidsequenz nach einem der Anspruche 12 bis 14, welche 
in der Gentherapie einsetzbar ist. 

15 

Claims 

1. A recombinant polypeptide comprising an active part derived from a polypeptide having a therapeutic activity, 
20 genetically coupled to an albumin or a variant of albumin, wherein the variant of albumin conserves a high plasma 

half-life, characterised in that the polypeptide having a therapeutic activity is chosen from among hormones, 
interferons, interleukins, erythropoietin, G-CSF and insulin. 

2. A polypeptide according to Claim 2 characterised in that the polypeptide having a therapeutic activity is a polypep- 
25 tide of human origin. 



30 



3. A polypeptide according to Claim I or 2 characterised in that the active part has a structure chosen from 

(a) an entire peptide structure or 

(b) a fragment of (a) or a structure derived from (a) by structural modification (mutation, substitution, and/or 
deletion of one or more residues) and conservation of therapeutic activity. 

4. A polypeptide according to one of Claims 1 to 3 characterised in that the albumin or albumin variant has a structure 
35 chosen from: 

(a) mature albumin; 

(b) albumin; and 

40 

(c) a structure derived from (a) or (b) by structural modification (mutation, substitution, addition and/or deletion 
of one or more residues) and conserving a high plasma half-life. 

5. A polypeptide according to one of Claims 1 to 4 characterised in that the polypeptide comprises an N-terminal 
45 methionine. 

6. A polypeptide according to one of Claims 1 to 5 characterised in that the polypeptide comprises a linker peptide. 

7. A polypeptide according to one of Claims 1 to 6 characterised in that the polypeptide comprises a secretion signal. 

50 

8. A polypeptide according to Claim 8 characterised in that the secretion signal is the natural secretion signal of 
the biologically active polypeptide. 

9. A polypeptide according to one of Claims 1 to 8 characterised in that the active part is coupled to the N-terminus 
55 of the albumin. 

10. A polypeptide according to one of Claims 1 to 8 characterised in that the active part is coupled to the C-terminus 
of the albumin. 
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1 1 . A polypeptide according to one of Claims 1 to 1 0 characterised in that the active part is represented several times. 

12. Nucleotide sequence encoding a polypeptide according to one of Claims 1 to 11. 

5 13. A nucleotide sequence according to Claim 12 characterised in that it comprises a sequence encoding a "leader" 
sequence permitting the secretion of the expressed polypeptide. 

14. An expression cassette comprising a nucleotide sequence according to one of Claims 1 2 and 1 3 under the control 
of a transcription initiation region and optionally a transcription termination region. 

10 

15. A self-replicating plasmid comprising an expression cassette according to Claim 14. 

16. A recombinant eukaryotic or prokaryotic cell in which has been inserted a nucleotide sequence according to Claim 
12 or 13 or an expression cassette according to Claim 14 or a plasmid according to Claim 15. 

15 

17. A recombinant cell according to Claim 16 characterised in that it is a yeast, animal, fungal or bacterial cell. 

18. A recombinant cell according to Claim 1 7 characterised in that it is a yeast cell. 

20 19. A recombinant cell according to Claim 18 characterised in that it is a cell from the genus Saccharomyces or 
Kluyveromyces. 

20. A process for preparing a polypeptide as defined in one of Claims 1 to 11 characterised in that one cultivates a 
recombinant cell according to one of Claims 1 6 to 19 under conditions for expression and one recovers the polypep- 

25 tide product. 

21. A pharmaceutical composition comprising one or more polypeptides according to Claims 1 to 11 or prepared by a 
process according to Claim 20. 

30 22. A pharmaceutical composition comprising a nucleotide sequence according to one of Claims 12 to 14 usable in 
gene therapy. 
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reQ, IP NO; 1 



AAGCT TTACAACAAA TATAAAAACA ATG AAG TOG GTA ACC TTT ATT TCC CTT CTT TTT CTC TTT 

Met Lys Trp Val Thr Phe lie Ser Leu Leu Phe Leu Phe -12 

AGC TCG OCT TAT TCC AGG OGT GTG TTT CGT CGA GAT OCA CAC AAG AGT GAG GTT OCT CAT 

Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys ser.Glu Val Ala His 9 

CGG TTT AAA GAT TTG GGA GAA GAA AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT OCT CAG 

Arg Phe. Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu lie Ala Phe Ala Gin 29 

TAT CTT CAG CAG TGT CGA. TTT GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT GAA TTT 

Tyr Leu Gin Gin cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe 49 

GCA AAA ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC AAA TCA CTT CAT AOC CTT 

Ala Lys Thr cys Val Ala Asp Glu Ser Ala Glu Asn cys Asp Lys Ser Leu His Thr Leu 69 

TTT GGA CAC AAA TTA TGC ACA GTT GCA ACT CTT CGT GAA ACC TAT GGT GAA ATG GCT GAC 

Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp 89 

TGC TGT GCA AAA CAA GAA CCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC 

Cys Cys Ala Lys Gin Glu Pro Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn 109 

OCA AAC CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC 

Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp 129 

AAT GAA GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC AGA AGA CAT CCT TAC TTT 

Asn Glu Glu Thr Phe Leu Lys* Lys Tyr Leu Tyr Glu He Ala Arg Arg His Pro Tyr Phe 149 

TAT GCC COG GAA CTC CTT TTC TTT GCT AAA AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC 

Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys 169 

CAA GCT GCT GAT AAA GCT GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG 

Gin Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly 189 

AAG GCT TCG TCT GCC AAA CAG AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA GAA AGA 

Lys Ala Ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg 209 

GCT TTC AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT CCC AAA GCT GAG TTT GCA 

Ala Phe . Lys Ala Trp Ala val Ala Arg Leu ser Gin Arg Phe Pro Lys Ala Glu Phe Ala 229 

GAA GTT TCC AAG TTA GTG ACA GAT CTT AOC AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT 

Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp 249 

Figure 2(a) 
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CTG CTT GAA TGT GCT GAT GAC AOG GOG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT 

Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr lie Cys Glu Asn Gin Asp 269 

TOG ATC TCC AGT AAA CTG AAG GAA TOO TGT GAA AAA OCT CTG TTG GAA AAA TCC CAC TGC 

Ser lie Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Sec His Cys 289 

ATT GCC GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG CCT TCA TTA GCT GCT GAT TTT 

lie Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe 309 

GTT GAA AGT AAG GAT GTT TGC AAA AAC TAT GCT GAG OCA AAG GAT GTC TTC CTG GGC ATG 

Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met 329 

TTT TTG TAT GAA TAT GCA AGA AGG CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT 

Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu 349 

GCC AAG ACA TAT GAA AOC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT OCT CAT GAA TGC 

Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His G}u Cys 369 

TAT GCC AAA GTG TTC GAT GAA TTT AAA OCT CTT GTG GAA GAG OCT CAG AAT TTA ATC AAA 

Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin Asn Leu lie Lys 389 

CAA AAT TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC AAA TTC CAG AAT GOG CTA TTA GTT 

Gin Asn.Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val 409 

CGT TAC ACC AAG AAA GTA CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC 

Arg Tyr Thr lys Lys Val Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn 429 

CTA GGA AAA GTG GGC AGC AAA TGT TCT AAA CAT CCT GAA GCA AAA AGA ATG CCC TGT GCA 

Leu Gly Lys Val Gly Ser Lys cys Cys Lys His Pro Glu Ala Lys Arg Met Pro cys Ala 449 

GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG CAT GAG AAA ACG OCA GTA 

Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu Lys Thr Pro Val 469 

AGT GAC AGA GTC AOC AAA TGC TGC ACA GAA TCC TTG GTG AAC AGG CGA OCA TGC TTT TCA 

Ser Asp Arg Val Thr Lys cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser 489 

GCT CTG GAA GTC GAT GAA ACA TAC GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC 

Ala Leu Glu val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe 509 

CAT GCA GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT 

His Ala Asp He Cys Thr Leu Ser Glu Lys Glu Arg Gin He lys Lys Gin thr Ala Leu 529 

GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA GCT GTT ATG GAT 

Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys Ala Val Mec Asp 549 

GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC 

Asp Phe Ala Ala Phe Val Glu Lys cys Cys Lys Ala Asp Asp lys Glu Ttir Cys Phe Ala 569 

MetXI 

GAG GAG GGT AAA AAA CTT GTT GCT GCA AGT CAA GCT GCC TTA GGC TTA (NNN)p TAA QCTT 
Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gin Ala Ala Leu Gly Leu (X)p *** 



Figure 2(b) 
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Figure 4A 

CC TTA GGC TTA (NNN) 244 TAA QCTT 

Leu Gly Leu <Thr470-> v al7l3) *** 



CC TTA QQC tta . (NNN) 29 taa gctt Figure 4B 

. Leu Gly Leu (Thr470->Asp498) •** 



CC TTA COC CTC (NNN) 14 TAA GCTT 

Leu Gly Leu (Cys695->Pro70B) ••• A r* 
< D5 > Figure 4C 



CC TTA..GGC TTA (NNN) 90 TAA GCTT 

Leu Gly Leu (Thr47o->Tyr508'Arg663->Val7l3> * # * 

Figure 4D 



Figure 4 (A h D) 
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S5Q. IP NP ; 2 



OC TTA GGC TTA ACC TGT GAA GOC TGC CAG GAG CCG GGA GGC CTG GTG GTG CCT COC ACA 

Leu Gly Leu Hir cys Glu Ala cys Gin Glu Pro Gly Gly Leu Val Val Pro Pro Thr 601 

SAH< 1 >W7F«70->713 

GAT GOC CCG GTG AGC COC ACC ACT CTG TAT GTG GAG GAC ATC TCG GAA COG CCG TTG CAC 

Asp Ala Pro val Ser Pro Thr Thr Leu Tyr Val Glu Asp tie Ser Glu Pro Pro Leu His 621 

GAT TTC TAC TGC AGC AGG CTA CTG GAC CTG GTC TTC CTG CTG GAT OGC TOC TOC AGG CTG 

Asp Phe Tyr cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu Asp Gly Ser ser Arg Leu 641 

TCC GAG OCT GAG TTT GAA GTG CTG AAG GCC TTT GTG GTG GAC ATG ATG GAG COO CTG COC 

Ser Glu Ala Glu Phe Glu Val Leu Lys Ala Phe val Val Asp Met Met Glu Arg Leu Arg 661 

ATC TCC CAG AAG TOG GTC CGC GTG GCC GTG GTG GAG TAC CAC GAC GGC TOC CAC GOC TAC 

lie Ser Gin Lys Trp Val- Arg Val Ala val Val Glu iyr His Asp Gly Ser His Ala Tyr 681 

ATC GOG CTC AAG GAC CGG AAG CGA CCG TCA GAG CTG CGG OGC ATT GOC AGC CAG GTG AAG 

He Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg He Ala Ser Gin Val Lys 701 

TAT GOG GGC AGC. CAG GTG GOC TOC ACC AGC GAG GTC TTG AAA TAC ACA CTG TTC CAA ATC 

Tyr Ala Gly Ser Gin Val Ala Ser Thr ser Glu Val Leu Lys Tyr Thr Leu Phe Gin lie 721 

TTC AGC AAG ATC GAC CGC CCT GAA GCC TOC OGC ATC GCC CTG CTC CTG ATG GOC AGC CAG 

Phe Ser Lys He Asp Arg Pro Glu Ala Ser Arg He Ala Leu Leu Leu Met Ala Ser Gin 741 

GAG CCC CAA CGG ATG TCC CGG AAC TTT GTC OGC TAC GTC CAG GGC CTG AAG AAG AAG AAG 

Glu Pro Gin Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gin Gly Leu lys Lys Lys Lys 761 

GTC ATT GTG ATC COG GIG GOC ATT GGG CCC CAT GCC AAC CTC AAG CAG ATC CGC CTC ATC 

Val He Val He Pro Val Gly He Gly Pro His Ala Asn Leu Lys Gin He Arg Leu He 781 

GAG AAG CAG GOC CCT GAG AAC. AAG GOC TTC GTG CTG -AGC ACT GTG GAT GAG CTG GAG CAG 

Glu Lys Gin Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu Gin 801 

CAA AGG GAC GAG ATC GTT AQC TAC CTC TGT GAC CTT GCC CCT GAA GCC OCT CCT CCT ACT 

Gin Arg Asp Glu He Val Ser Tyr Leu cys Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr 821 

CTG CCC CCC GAC ATG GCA CAA GTC TAA GCTT 

Leu Pro Pro Asp Met Ala Gin Val *** 829 

Figure 4 (E) 
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Figure 5 
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Figure 6 
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Figure 7 
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<55Q. |D NO ; 3 



CC TTA GGC TTA AGC AAT GAA CTT CAT CAA OTT CCA TOG AAC TGT GAC TGT CTA AAT OGA 

Leu Gly Leu Ser Asn Glu Leu His Gin val Pro ser Asn Cys Asp Cys Leu Asn Gly 601 
SAH< 1 — ->UK 

GGA ACA TGT GTG TCC AAC AAG TAC TTC TCC AAC ATT CAC TGG TGC AAC TGC OCA. AAG AAA 

Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn lie His Trp cys Asn Cys Pro Lys Lys 621 



TTC GGA GGG CAG CAC TGT GAA ATA GAT AAG TCA AAA AOC TGC TAT GAG GGG AAT GGT CAC 
Phe Gly Gly Gin His Cys Glu He Asp Lys Ser lys Thr cys Tyr Glu Gly Asn Gly His 641 

EGF- LXKR< 1 — >KRINGLB 

TTT TAC CGA GGA AAG GCC AGC ACT GAC ACC ATG GGC COG COC TGC CPG COC TGG AAC TCT 

Phe tyr Arg Gly Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser 661 



GCC ACT GTC CTT CAG CAA ACG TAC CAT GCC CAC AGA TCT GAT OCT CTT CAG CTC GGC CTG 

Ala Thr Val Leu Gin Gin Thr Tyr His Ala His Arg Ser Asp Ala Leu Gin Leu Gly Leu 681 



GGG AAA CAT AAT TAC TGC AGG AAC CCA GAC AAC CGG AGG CGA COC TGG TGC TAT GTG CAG 

Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg Arg Arg Pro Trp Cys Tyr Val Gin 701 



GTG GGC CTA AAG CCG CTT GTC CAA GAG TGC ATG GTG CAT GAC TGC GCA GAT GGA AAA TAA 

Val Gly Leu Lys Pro Leu Val Gin Glu Cys Met Val His Asp cys Ala Asp Gly Lys *•* 720 



GCTT 



Figure 8 
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Figure 9 



49 



EP 0 624 195 B1 



Apal 

OC TTA GOC TTA ACC COC C TC HflC CTT GOC AOC TOC CTG OCC CAG AGC TTC CTC CTC AAG 

Leu Gly Leu Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu Lys 601 
SAB< 1 >Q-CSF 

TGC TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GOC GCA GOG CTC CAG GAG AAG CTC TGT 

Cys Leu Glu Gin Val Arg Lys He Gin Gly Asp Gly Ala Xla Leu Gin Clu Lys Leu Cys 621 

GOC AOC TAC AAG CTG TGC CAC OCC GAG GAG CTG GTG CTC CTC GGA CAC TCT CTC GGC ATC 

Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly lie 641 

Sotx 

OCC TGG GCT COC C TG AOC Tp C TGC COC AGC CAG GOC CTC CAG CTC GCA GGC TGC TTG AGC 

Pro Trp Ala pro Leu Ser Ser Cys Pro Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser 661 

CAA CTC CAT AGC GGC CTT TTC CTC TAC CAG GOG CTC CTC CAG* GOC CTG GAA GGG ATA TOC 

Gin Leu His Ser Gly Leu Phe Leu Tyr Gin Gly Leu Leu Gin Ala Leu Glu Gly He Ser 6B1 

COC GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG GAC GTC GCC GAC TTT GOC ACC ACC 

Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp Val Ala Asp Phe Ala Thr Thr 701 

ATC TGG CAG CAG ATG GAA GAA CTG GGA ATC GOC OCT GOC CTG CAG CCC AOC CAG GGT GOC 

He Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gin Pro Thr Gin Gly Ala 721 

ATG CCG GCC TTC GOC TCT GCT TTC CAG GGC COG GCA GGA GGG GTC CTG GTT GCT AGC CAT 

Met Pro Ala Phe Ala Ser Ala Phe Gin Arg Arg Ala Gly Gly Val Leu Val Ala Ser His 741 

' CTG CAG AGC TTC CTG GAG GTG TOG TAC COC GTT CTA CGC CAC CTT GOG CAG COC TGA AGCTT 
Leu Gin Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gin Pro «•* 759 



Figure 10 
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SEQ. id NO; 5 



ApaX 

: coc cro.gsc q 
r Pro Leu Gly P 
-X*-CSF 

5 AGG AAG ATC C 
L Arg Lys lie G 

I TGC CAC CCC G 
i cys His Pro G 



CTT 
Leu 


TTT 
Phe 


CTC 
Leu 


TTT 
Phe 


GCC 
Ala 


AGC 
Ser 


TCC 
Ser 


CTG 
Leu 


GQC 
Gly 


GAT 
Asp 


GQC 
Gly 


GCA 
Ala 


GAG 
Glu 


CTG 
Leu 


CTC 
Val 


CTG 
Leu 


AGC 
Ser 


CAG 
Gin 


GCC 
Ala 


CTG 
Leu 


CAG 
Gin 


GGG 
Gly 


CTC 
Leu 


CTG 
Leu 



12 
9 
29 
49 
€9 
8 * 

CAG GCC CTG GAA GGG ATA TGC CCC GAG TTG GOT CCC ACC TTG GAC ACA CTG CAG CTG GAC 

Gin Ala Leu Glu Gly He Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp 109 

CTC GCC GAC TIT GQC AOC AOC ATC TOS CAG CAG ATS GAA GAA CTG GGA ATC .QOC OCT GCC 

Val Ala Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala 129 

CTG CAG CCC ACC CAG GOT QOC ATG COG GCC TTC GCC TCT OCT TTC CAG CGC CGG GCA GGA 

Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gin Arg Arg Ala Gly 149 

GGG GTC CTG GTT GCT AGC CAT CTG CAG AGC TTC CTG GAG GTG TOG TAG CGC GIT CTA CGC 

Gly Val Leu Val Ala ser His Leu Gin ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg 169 

CAC CTT GOG CAG CCC OCT GGA flflT (CT GAT GCA CAC AAG ACT GAG GTT GCT CAT CGG TTT 

His Leu Ala Gin Pro Glv Glv Glv civ Asp Ala His Lys Ser Glu Val Ala His Arg Phe 189 

g-csf<— I linker I >sah 

AAA GAT TTG GGA GAA GAA AAT TTC AAA GCC TTG GTG TTG ATP GCC TTT GCT CAG TAT CTT 

Lys- Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu lie Ala Phe Ala Gin Tyr Leu 209 

CAG CAG TGT CCA TTT GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT GAA TTT GCA AAA 

Gin Gin Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys 229 

ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC AAA TCA CTT CAT ACC CTT TTT GGA 

Thr cys Val Ala Asp Glu Ser Ala Glu Asn cys Asp Lys Ser Leu His Thr Leu Phe Gly 249 

GAC AAA TTA TGC ACA GTT GCA ACT CTT CGT GAA AOC TAT OCT GAA ATG GCT GAC TGC TGT 

Asp lys Leu cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys 269 

GCA AAA CAA GAA CCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC OCA AAC 

Ala Lys Gin Glu Pro Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn Pro Asn 289 

CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC AAT GAA 

Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu 309 

GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC AGA AGA CAT CCT TAC TTT TAT GCC 

Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu lie Ala Arg Arg His Pro Tyr Phe Tyr Ala 329 



Figure 11 (a) 
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CCC GAA CTC CTT TTC TTT GCT AAA AOG TAT AAA OCT OCT TTT ACA GAA TGT TGC CAA GCT 

Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala 349 

GCT GAT AAA GCT GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT OGG GAT GAA GGG AAG GCT 

Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala 369 

TCG TCT GCC AAA CAG AGA CTC AAG TGT GCC ACT CTC CAA AAA TTT GGA GAA AGA GCT TTC 

ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg Ala Phe 389 

AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT CCC AAA GCT GAG TTT OCA GAA GTT 

Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe Pro Lys Ala Glu Phe Ala Glu Val 409 

TCC AAG TTA GTG ACA GAT CTT ACC AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT 

Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu 429 

GAA TGT GCT GAT G AC AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC 

Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr lie Cys Glu Asn Gin Asp Ser He 449 

TCC AGT AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC ATT GCC 

Ser Ser Lys Leu Lys Glu Cys cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys lie Ala 469 

GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG OCT TCA TTA GCT GCT GAT TTT GTT GAA 

Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val £lu 489 

ACT AAG GAT GTT TGC AAA AAC TAT GCT GAG GCA. AAG GAT GTC TTC CTG OQC ATG TTT TTC 

Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu 509 

TAT GAA TAT GCA AGA AGG CAT OCT GAT TAC TCT CTC GTA CTG CTG CTG AGA CTT GCC AAG 

Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser val Val Leu Leu Leu Arg Leu Ala Lys 529 • 

ACA TAT GAA ACC ACT CTA GAG AAG TGC TGT GOC OCT GCA GAT CCT CAT GAA TGC TAP GCC 

Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala 549 

AAA CTG TTC GAT GAA TTT AAA OCT CTT GTG GAA GAG OCT CAG AAT TTA ATC AAA CAA AAT 

Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin Asn Leu He lys Gin Asn 569 

TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC AAA TTC CAG AAT GOG CTA TTA GTT OGT TAC 

cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr 589 

ACC AAG AAA GTA CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC CTA GGA 

Thr Lys Lys Val Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly 609 

AAA GTG QGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC TGT GCA GAA GAC 

Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp 629 

TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG CAT GAG AAA ACG OCA GTA AGT GAC 

Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp 649 

AGA GTC ACC AAA TGC TGC ACA GAA TCC TTG GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG 

Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu 669 

GAA GTC GAT GAA ACA TAC GTT CCC AAA GAG TTT AAT OCT GAA ACA TTC ACC TTC CAT GCA 

Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala 689 

GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT GTT GAG 

Asp lie Cys Thr Leu Ser Glu Lys Glu Arg Gin lie lys lys Gin Thr Ala Leu Val Glu 709 

CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA GCT GTT ATG GAT GAT TTC 

Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys Ala Val Met Asp Asp Phe 729 

GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG 
Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp lys Glu Thr Cys Phe Ala Glu Glu 749 

KotXX 

GGT AAA AAA CTT GTT GCT GCA AGT CAA GCT GCC TTA CCT TTA TAA CATCACATTT 

Gly Lys Lys Leu Val Ala Ala Ser Gin Ala Ala Leu Gly Leu *** 763 

AAAAGCATCT CAGCCTACCA TG AG AAT AAG AGAAAGAAAA TGAAGATCAA AAQCTT 



Figure 11 (b) 
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Figure 12 
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Figure 13 
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SEP. ID NO: 6 



OC TTA GOC TTA CAG GTG CAG CTC GAG CAG TCT GGA CCT GAG CTG GTG AAG OCT QGG QCC 

Leu Gly Leu Gin Val Gin Leu Glu GXn Ser Gly Pro Glu Leu Val Lye Pro Gly Ala 601 
SAH< 1 >VH 

TCA GTG AAG ATT TCC TGC AAA OCT TCT GGC TAG GCA TTC ACT AOS TCT TOO ATG AAC TOG 

Ser Val Lys He Ser Cys lys Ala Ser Gly Tyr Ala Phe Ser Arg Ser Trp Met Asn Trp 621 

GTG AAG CAG AGG CCT GGA CAG GGT CTT GAG TOG ATT GGA QGG ATT TAT OCT GGA CAT GGA 

Val Lys Gin Arg Pro Gly Gin Gly Leu Glu Trp He Gly Arg He Tyr Pro Gly Asp Gly 641 

GAT ACC AAA TAC AAT QGG AAG TTC AAG GGC AAG GOC ACA CTG ACT GOG GAC AGA TCA TCC 

Asp Thr Lys Tyr Asn Gly Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Arg Ser Ser 661 

AGC ACA GOC TAC ATG CAG CTC AGC AGC CTG ACC TCT GTG GGC TCT GOG GTC TAT TTC TCT 

Ser Thr Ala Tyr Met Gin Leu Ser Ser Leu Thr Ser Val Gly Ser Ala Val Tyr Phe cys 681 

GCA AAA GAG AAC AAT AGG TTC GAC GAG AGG GGT TAC TAT GCT ATG GAC TAC TOG GGC CAA 

Ala Lys Glu Asn Asn Arg Phe Asp Glu Arg Gly Tyr Tyr Ala Met Asp Tyr Trp Gly Gin 701 

GGG ACC ACS GTC ACC GTC TOC TCA GGT GGC OCT GGC TOG GGC GGT QC7P Q Qg TOG GGT GGC 
Gly Thr Thr Val Thr Val Sex Ser Glv Glv Olv Glv Ser Glv Glv Glv ttlv Sot- niv nw 721 

VH< 1 llnJcer synthetdLqua . 

GGC OGA TCT AAC ATT CAG TTG ACC CAG TCT OCA AAT TOC ATG TOC ACA TCA OTA GGA GAC 
Gly CilY Sftr Asn He Gin Leu Thr Gin Ser Pro Asn Ser Met Ser Thr Ser Val Gly Asp 741 
I >VL 

AGG GTC AGC ATC ACC TGC AAG GOC ACT CAG GAT GTG GAT ACT TCP GTA GCC TOG TAT CAA 

Arg Val Ser He Thr Cys Lys Ala Ser Gin Asp Val Asp Thr Ser Val Ala Trp Tyr Gin 761 

CAG AAA CCA GGG CAA TCT OCT AAA CTA CTG ATT TAC TGG GCA TOC ACC COG CAC ACT GGA 

Gin Lys Pro Gly Gin Ser Pro Lys Leu Leu He Tyr Trp Ala Ser Thr Arg His Thr Gly 781 

GTC OCT GAT CGC TTC ACA GGC ACT GGA TCT GGG ACA GAT TTC ACT CTC ACC ATT AGC AAT 

Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr He Ser Asn 801 

GTG CAG TCT GAA GAC TCG GCA GAT TAT TTC TGT CAG CAA TAT AGC AGC TAT COG TGG ACG 

val Gin Ser Glu Asp ser Ala Asp Tyr Phe cys Gin Gin Tyr Ser Ser Tyr Pro Trp Thr 821 

TTC GGT GGA GGG ACC AAG CTG GAG ATC AAA TAA GCTT 

Phe Gly Gly Gly Thr Lys Leu Glu lie Lys 831 

Figure 14 
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Figure 15 
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Figure 16 
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